作者:乔晶 腾讯集团专家法律顾问
数据是数字经济发展的关键要素,更逐渐成为国家重要的战略性资源。去年年底,国务院专门发布《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》,提出了20条政策举措,包括建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度等。将数据作为新兴生产要素,已经成为我国的政策选择。
在司法实践中,涉及数据不正当竞争的相关案件也在逐年增多。今年4.26期间,包括广东高院、浙江高院、海淀法院、浦东法院等多家法院评选出多件数据相关的知识产权典型案例,旨在为审理类似案件提供相关参照标准。随着案件数量的增加以及案件越发具有复杂性、多样性等特点,对于如何合理划分数据权益权属及边界,妥善审理数据确权、交易、服务、隐私保护等案件,如何引导经营者通过技术创新等方式形成良性竞争,净化市场环境,激发市场活力,规范市场秩序等内容均值得深入探讨。基于此,由中国政法大学数据法治实验室与知产财经全媒体联合主办的“首届数据权益保护实务论坛”于5月27日在北京召开。会议邀请了来自学术界、司法界、产业界等代表围绕数据权益相关话题展开交流和研讨。会上,腾讯集团专家法律顾问乔晶进行主题演讲,知产财经对其主讲内容进行了整理,以飨读者。
尊敬的各位领导、各位嘉宾,大家上午好!非常荣幸能够参加今天的研讨会,也非常高兴能够借这个机会把我们对于平台数据保护相关问题的一些看法和观点跟大家分享和讨论。
数据是数字经济时代关键的生产要素,也逐步成为国家重要的战略性资源。对于数据的价值及数据的可保护性,无论是在国家的政策层面还是司法的实践层面,都已经达成了共识。比如2022年12月,国务院公布《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据20条”),提出20条政策举措,包括建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度等。其中关于“数据权益保护”,《意见》中提到:“合理保护数据处理者对依法依规持有的数据进行自主管控的权益。在保护公共利益、数据安全、数据来源者合法权益的前提下,承认和保护依照法律规定或合同约定获取的数据加工使用权,尊重数据采集、加工等数据处理者的劳动和其他要素贡献,充分保障数据处理者使用数据和获得收益的权利。保护经加工、分析等形成数据或数据衍生产品的经营权,依法依规规范数据处理者许可他人使用数据或数据衍生产品的权利,促进数据要素流通复用。”
一、平台数据可保护性
在司法实践当中,从2016年新浪微博诉脉脉案,到后续的大众点评诉百度地图案、新浪微博诉今日头条案、淘宝诉美景案等,以及近期的抖音诉刷宝案、抖音诉小葫芦案等,在这些案件中司法机关已经基本达成了共识,即认为对于平台上产生的数据,包括用户生成的数据,能够为平台带来经济利益,是平台核心的竞争资源,具有无形财产的属性,应当受到法律的保护。不过如何对数据进行保护,对数据是否应该分类分级进行保护?对这个问题目前在行业内还有很多不同的看法和争议。
(一)平台公开数据是否应受保护
目前有观点认为,相比于非公开数据,对于平台上的公开数据不应该给予保护或只应给予弱保护。首先对于公开数据的界定目前还没有非常明确的共识。有的观点认为,在没有受到平台账号登录机制保护下的数据,即用户不需要登录就可以浏览到的网站上的相关内容属于公开数据。也有观点认为,不论登录与否,只要是在产品前端可以看到的信息内容,都属于公开数据。
暂且不论如何区分公开数据和非公开数据,在讨论是否要对公开数据给予保护之前,我想先讨论几个概念问题。
1. 公开信息内容 vs. 公开数据
用户在浏览一个平台时,在前端所看到的只是公开的信息内容,而这个信息内容的载体才是数据本身,数据存储在平台的服务器上。公开信息内容并不等于公开数据,平台对于这些数据仍然具有管理权和控制权。也就是说平台允许用户在前端免费浏览相关的内容,并不意味着平台要放弃或让渡对于后台相关数据的管理权或控制权,也包括安全管理的权利。
从另外一个角度来讲,用户在使用平台的服务,在前端浏览相关的内容,并不意味着因此就获得了这些平台数据的持有权和使用权,这就是公开信息与所谓的公开数据的区别。
2. 公开数据 vs. 公共数据
公共数据主要是指政府的公务数据,具有一种公益的属性,国家现在也在提倡要对公共数据进行共享和开放。“数据二十条”当中对于数据进行了分类,包括公共数据、企业数据、个人数据。平台上的公开数据显然属于企业数据的范畴,具有私人财产的属性,“数据二十条”并没有认为对企业公开数据的保护力度应该降低。
平台的所谓公开数据仍然是平台的私有财产,平台收集和处理这些数据所需要付出的成本并不会因此降低。无论是公开数据还是非公开数据,平台都需要长期投入大量的人力、物力、财力来提升平台相关的功能、用户的使用体验、平台的生态系统等,以吸引用户使用产品,形成所谓的公开数据。从这个角度来讲,平台对收集这些公开数据所付出的成本与非公开数据没有任何差别。而且平台公开数据对平台的商业价值也没有差异,由于互联网产品具有开放的属性,从这个意义上来讲,公开数据相比于非公开数据可能对于平台的商业价值更加重要。
从以上这几个角度来分析,对平台的公开数据应该给予非公开数据同样的法律保护。
(二)单一用户数据是否应受保护
目前有观点认为,相比于数据集合,对于单一用户数据不应该给予同等保护。在讨论这个问题之前,首先要明确如何去界定单一用户数据。在实践当中界定单一用户数据应该是非常困难的。比如用户在某个平台上发表了一条评论,应该属于单一用户数据。那么他发表的两条、三条评论还是单一用户数据吗?在这个平台上发表的全部评论还是单一用户数据吗?包括用户发表的评论以及这个用户的账号昵称、点赞等数据还属于单一用户数据吗?在实践当中我们会发现,很难去界定单一用户数据和数据集合的边界在哪里,如果边界界定不清,那在司法实践当中可能就会产生更多的争议。
事实上,平台数据集合的形成是通过每一次跟用户进行交互,收集用户每一次在平台上的使用行为数据逐渐积累而成的。也就是说,用户的每一次使用行为形成了一个所谓的单一用户数据,平台对每个单一用户数据的收集都需要付出成本,最终才可能形成一个数据集合。如果对单一用户数据不给予保护,那么假设这样一个场景:B平台通过API接口或者其他相关的技术能力,每次只获取A平台上的一个单一用户数据,最终通过日积月累的行为,最终会把A平台的整个数据集合搬运到B平台。这样会出现一个悖论,即每次的获取单一用户数据的过程是合法的,但是最终形成的后果是非法的,这显然不合逻辑。因此无论对于单一用户数据还是数据集合,都应该给予同等法律保护。而且根据三重授权原则,即平台对于平台上的数据享有权利,并没有区分单一用户数据和数据集合。
二、未经许可“获取”他人数据的可责性
(一)未经许可获取他人数据具有可责性
对平台的数据,不论是公开数据还是非公开数据,单一数据还是数据集合,都应该受到法律的保护,基于这样的前提,未经平台许可获取平台的数据,这个行为本身应该是一个具有可责性的行为。但现在还有一些观点认为,对于未经许可的获取行为不应单独做评价,需要结合后续的使用行为综合来看。甚至还有观点认为,只有后续的使用行为构成实质性替代使用,整个的“获取+使用”行为才构成侵权。
获取行为本身是一个独立的行为,如果说获取行为已经违背了平台经营者的意愿,已经伤害了平台对于数据的管理权和控制权,这种行为本身就应当具有可责性。后续的使用行为无论具体形式如何,都相当于是“毒树之果”,显然也具有不当性。因此对于未经许可获取数据的行为本身应该给予否定性的评价。在相关司法案件当中其实也可以看到有这个裁判思路,比如在新浪微博诉脉脉案件中,法院认为,双方合作终止后,二被告没有及时删除从微梦公司获取的新浪微博用户头像、名称(昵称)、职业、教育、个人标签等信息,而是继续使用。二被告的上述行为,危害到新浪微博平台用户信息安全,损害了微梦公司的合法竞争利益,对微梦公司构成不正当竞争。以及在 “酷米客”诉“车来了”案件中,法院认定,非未经谷米公司许可,利用网络爬虫技术进入谷米公司的服务器后台的方式非法获取,故被告元光公司以原告谷米公司的数据可自由访问来证明其获取方式合法性的主张不能成立。
(二)网络爬虫违反Robots协议抓取他人数据的可责性
数据获取目前普遍采用的技术手段还是数据爬虫形式。讲到数据爬虫,就不得不提到Robots协议。Robots协议形成于1993年、1994年前后,当时,随着互联网的发展,网络上的内容越来越丰富,同时,一些早期的搜索引擎包括一些信息收集网站的发展,出现了不少网络爬虫,自动收集网络上的内容。在这种情况下,网站所有者希望可以通过某种手段使自己网站上的全部或者部分内容不被抓取,或者仅允许部分爬虫抓取,以保护自己的权益或者隐私,而搜索引擎也希望可以合理地获取网络上的内容。为此,网站所有者和搜索引擎人员一起,通过邮件组开始讨论,共同起草了Robots协议,其核心思想是要求Robot程序不要去检索那些网站站长们不希望被直接搜索到的内容。由此可见,Robots协议体现了网站管理者对于网站内容的管理权和控制权。Robots协议已经成为一项技术规范,相关的互联网平台都会通过Robots协议的设置,来对外公示哪些内容可以被爬取,以及允许哪些爬虫爬取。
但是目前有些爬虫会无视网站的Robots协议设置,违反Robots协议进入网站爬取相关的数据。无论对于搜索引擎爬虫还是非搜索引擎爬虫,违反Robots协议爬取数据的行为显然违背了公认的行业规范,具有不当性。但目前有观点认为,网站的Robots协议设置必须要具有合理性,否则搜索引擎爬虫违反Robots协议爬取数据不具有不当性。这个观点显然毫无依据。首先从前述介绍的Robots协议产生的背景来看,并没有要求网站自证其Robots协议设置具有合理性,事实上,robots协议设置是给予网站自主管理的权利,并没有要求对Robots协议进行合理性审查。其次,目前主流的搜索引擎网站都会公开声明,会遵守各个网站设置的robots协议,并没有将robots协议设置必须具有合理性作为遵守的前提。
相比于搜索引擎爬虫在一定程度上可以为目标网站带来一定的流量,,非搜索引擎爬虫唯一的目的就是把别人的数据拿过来据为己有,为己所用,对于目标网站百害而无一利。因此对于非搜索引擎爬虫的规制应该更加严格,其更应该遵守平台的Robots协议,否则构成侵权。。另外,即便有的网站没有设置Robots协议,也并不代表非搜索引擎爬虫可以随意将他人网站的数据据为己有,非搜索引擎爬虫在未获得网站明确许可的情况下爬取数据仍然具有不当性。
综上,对平台上的数据应该给予保护,未经平台的许可,尤其是违反平台的Robots协议进行数据爬取的行为,应该构成侵权。
三、数据垄断法律判断
可能很多人会有一个担心,给平台数据这么强的保护,会不会导致平台数据垄断的危险?数据垄断是指对数据来源的排他性占有和绝对性控制,控制数据产生的源头,例如某类数据的收集、处理渠道被被个别平台控制,其他平台无法通过自身合法经营获取、处理同类数据。比如公共数据可能是具有垄断数据的特征,只有政府机关才有权去收集这样的数据。正是因为如此,我们国家才强调公共数据应该共享和开放。
对于其他平台上产生的数据,是否天然具有垄断的性质?我们认为是不具有的。平台的数据从哪里来?是从用户来,只要用户没有被特定平台控制,那任何平台都可以通过提供相应的平台服务从用户获取相应的数据。从这个角度来讲,数据来源是开放的,因此在这种情况下讨论数据垄断就应该特别谨慎,不能因为平台大、用户多、数据多,就认为这个平台自然有数据垄断。
在对平台进行数据垄断分析时,需要依据垄断法进行严格认定,尤其是对相关市场的分析。因为对于同样的数据,如果原告不同,需求不同,相关市场的范围可能就会有所不同。比如同样是电商平台相关的数据,如果原告希望获得这些数据来分析用户的网上消费行为,他的替代产品可能就是所有电商平台的数据。如果原告的诉求是分析所有网民的上网习惯,替代的数据就可能是全部互联网平台上的数据。因此对于原告需求的不同,对相关市场的分析应该进行个案界定。相关市场的不同可能就会导致同样的平台数据所具有的支配力量不同。而且法律并不禁止垄断地位,法律禁止的是获取垄断地位之后滥用垄断地位的行为,所以还要进一步分析具体的行为,以及该行为是否限制、影响了市场竞争。总的来说,对于平台的数据垄断应该依法进行严格的个案分析。
以上是今天跟大家分享的内容,不当之处请指正,谢谢。
(本文仅代表作者个人观点,不代表知产财经立场)