作者:乔 晶 腾讯集团专家法律顾问
近年来,网络不正当竞争纠纷日益增多。如何更好地理解和适用网络平台有关竞争的法律条款,如何合理划分数据权益权属及边界,妥善审理数据确权、交易、服务、隐私保护等案件,如何引导经营者通过技术创新等方式形成良性竞争,净化市场环境,激发市场活力,规范市场秩序等内容均值得深入探讨。有鉴于此,由浙江省高级人民法院知识产权审判庭、杭州知识产权法庭指导,知产财经全媒体主办,杭州市西湖区人民法院协办的“网络不正当竞争法律实务问题研讨会”于4月22日在杭州召开。腾讯集团专家法律顾问乔晶围绕“互联网平台数据权益保护”相关话题进行主题演讲,知产财经对其主讲内容进行了整理,以飨读者。
各位嘉宾,大家上午好,非常荣幸参加今天的研讨会。我分享的题目是互联网平台数据权益保护相关问题。众所周知,数据是数字经济的关键要素,是国家重要的战略性资源,已经成为一种非常重要的新型资产。尤其在去年年底,国务院公布《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《意见》),提出了20条政策举措,包括建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度等。
一、平台数据可保护性
关于数据权益保护方面,《意见》中提到,要“合理保护数据处理者对依法依规持有的数据进行自主管控的权益。在保护公共利益、数据安全、数据来源者合法权益的前提下,承认和保护依照法律规定或合同约定获取的数据加工使用权,尊重数据采集、加工等数据处理者的劳动和其他要素贡献,充分保障数据处理者使用数据和获得收益的权利。保护经加工、分析等形成数据或数据衍生产品的经营权,依法依规规范数据处理者许可他人使用数据或数据衍生产品的权利,促进数据要素流通复用。”
对于平台数据保护,司法机关在审理相关案件中也一直秉承基本相同的司法理念,认为平台数据是在平台上产生,承载着平台投入的资本及劳动,对于平台具有重大的经济利益及价值,属于一种无形资产,应该受到反不正当竞争法保护。从2016年的新浪微博诉脉脉案[1]开始,其应该属于平台数据保护的首例案件;到目前出现的很多类似案件,例如大众点评诉百度地图案[2]、新浪微博诉今日头条案[3]以及淘宝诉美景案[4]等。
在最近宣判的抖音诉刷宝案[5]中,二审法院认为,微播公司通过合法经营,投入巨大的人力、物力、财力,收集、存储、加工、传输抖音平台数据,形成了包括用户信息、短视频和用户评论在内的非独创性数据集合。该数据集合的规模集聚效应,能够为微博公司带来巨大的经济利益,在市场竞争中形成竞争优势,应当属于2019年反不正当竞争法保护的合法权益。
近几年随着数据保护的各种研究逐渐深入,有人提出了要加大数据互通、数据流动、数据共享的主张,并在此基础上提出了对于公开数据和非公开数据是否要采取不同的保护方式,对于用户的个体数据以及集体数据是否也要采取不同的保护方式等问题。
(一)平台上的公开数据应受到与非公开数据同等的法律保护
关于公开数据的保护,我们认为,不论是公开数据还是非公开数据,其本质上都是平台通过海量的人力、物力投入以及长期经营,通过从各层面提高平台体验、平台功能等方式吸引广大用户积极使用而积累汇聚形成的,所进行的投入相比于非公开数据并没有差别。且这些数据本身对于平台的经济价值也没有任何区别,所以从这个角度来讲,无论是公开数据还是非公开数据,都应该给予同等的法律保护。国内例如大众点评诉百度案、微博诉今日头条案、抖音诉刷宝案等以及美国最近结案的HiQ案,法院都认可对公开数据予以保护。
(二)平台上的单一数据应受到与整体数据同等的法律保护
关于个体数据(单一用户的数据)以及数据集合是否要给予不同的法律保护问题,首先应该明确的是,“三重授权原则”并不区分单一数据、整体数据。无论单一数据还是整体数据,均是在平台上产生的数据,本质上没有差别,整体数据系由单一数据聚合而成,如果对于数据集合要给予保护,那么对于构成数据集合的这种单一数据,也应该给予同等的保护。
否则会出现一种情况,假设a平台有大量的数据集合,b平台通过API接口方式或者数据同步等功能,可以每次只是获取单一用户的相关数据。如果单一的用户数据不给予保护,那么b平台每一次单独的获取行为均是合法的,这就会导致经过这种“蚂蚁搬家式”的日积月累,a平台的所有数据都会被搬运到b平台,在b平台上形成一个数据集合。所以如果对于单一数据不能给予保护,那么对于整体数据的保护可能就会被架空。因此我们认为无论对于单一的用户数据还是数据集合,都应该给予同等的法律保护。
二、未经许可获取他人数据的可责性
(一)案例分析
基于前面提到的平台对于平台上的数据享有合法权益,进而当然可以推导出,未经平台许可获取平台数据的行为应该构成侵权,在这里简单列举了几个案件。
· 新浪微博诉脉脉案[6]
双方合作终止后,二被告没有及时删除从微梦公司获取的新浪微博用户头像、名称(昵称)、职业、教育、个人标签等信息,而是继续使用。法院认为二被告的上述行为,危害到新浪微博平台用户信息安全,损害了微梦公司的合法竞争利益,对微梦公司构成不正当竞争。
· 淘宝诉美景案[7]
在本案中,法院认为,美景公司未付出自己的劳动创造,仅是将“生意参谋”数据产品直接作为自己获取商业利益的工具,其使用“生意参谋”数据产品也仅是提供同质化的网络服务。此种据他人市场成果直接为己所用,从而获取商业利益与竞争优势的行为,明显有悖公认的商业道德,属于不劳而获“搭便车”的不正当竞争行为,如不加禁止将严重挫伤大数据产品开发者的创造积极性,阻碍互联网产业的发展,进而会影响到广大消费者福祉的改善。
· 酷米客诉车来了案[8]
在本案中,法院认为,谷米公司“酷米客”软件实时公交信息数据虽然系免费提供公众查询,但获取数据的方式须以不违背该软件著作权人即谷米公司意志的合法方式获取,即应当通过下载“酷米客”手机APP或者登录谷米公司网站等方式来查询,而非未经谷米公司许可,利用网络爬虫技术进入谷米公司的服务器后台的方式非法获取,故被告元光公司以原告谷米公司的数据可自由访问来证明其获取方式合法性的主张不能成立。
(二)网络爬虫违反Robots协议抓取他人数据的可责性
关于获取其他平台上的数据,现在最广泛采用的一种技术手段是通过爬虫进行爬取,因此在这里跟大家着重讨论一下Robots协议的相关问题。
1.关于Robots协议
Robots协议是一种存放于网站根目录下的ASCII编码的文本文件,是应对网络爬虫机器人访问网站的一项技术规范。1994年6月30日,在经过搜索引擎人员以及被搜索引擎抓取的网站站长共同讨论后,正式发布了一份行业规范,即robots.txt协议。目前,网站服务商或所有者通过设置Robots协议,向网络爬虫告知该网站是否准许爬虫访问、准许哪些爬虫访问、访问的范围如何等。
在这里也列出了几大网站(如图1),包括微信公众号网站、微博网站、今日头条网站以及优酷网站的Robots协议。Robots协议并不是一种强制性的技术规范,举一个很简单的例子,Robots协议并不等于给家门上锁,而是相当于在家门前立了一个牌子,上面写着“私人区域,非请勿入”。有一些爬虫很守规矩,看到提示后就走掉了;但有一些爬虫不讲规矩,会选择视而不见,依然进入别人家中去拿东西。因此现在有很多因爬虫违反平台的Robots协议抓取数据被诉侵权的相关案件。
图1对于爬虫可以将其分为两大类,第一类是搜索引擎爬虫,第二类是非搜索引擎爬虫。
2.“搜索引擎网络爬虫”违反Robots协议抓取数据的可责性
什么是搜索引擎爬虫?像百度、Google这种搜索引擎网站所使用的爬虫,其爬取数据是为了提供搜索引擎服务,便于相关公众搜索到对应的网站内容。所以在一定意义上来讲,搜索引擎爬虫可以给目标网站带来一定的流量;
另外一类是非搜索引擎爬虫,其爬取数据的目的仅是把别人的数据据为己有,为己所用。
这两类爬虫都有所涉的相关案件。对于搜索引擎爬虫,目前司法判决基本达成共识,即搜索引擎爬虫应该遵守平台设置的Robots协议,当其违反平台的Robots协议爬取数据时构成侵权。
· 百度vs奇虎360案[9]
具体到本案中,在被告推出搜索引擎伊始,其网站亦刊载了Robots协议的内容和设置方法,说明包括被告在内的整个互联网行业对于Robots协议都是认可和遵守的。其应当被认定为行业内的通行规则,应当被认定为搜索引擎行业内公认的、应当被遵守的商业道德。被告网站在推出搜索引擎服务之初,包括在其搜索引擎服务上线之前的准备阶段,为了对原告网站进行抓取以便向网络用户提供最全面的搜索结果,没有遵守行业内公认的、应当被遵守的商业道德,即在被告推出搜索引擎的伊始阶段没有遵守原告网站的Robots协议,其行为明显不当,应当承担相应的不利后果。
· 腾讯vs神马搜索案[10]
可见,robots协议已经成为国内外搜索引擎行业普遍遵守的技术规范。基于以上事实,法院认定robots协议是互联网搜索引擎服务行业普遍遵守的商业道德......神马搜索虽明示遵守robots协议,但其网络机器人YisouSpider无视微信公众平台设置的robots协议,仍抓取微信公众平台内容作为搜索服务内容予以提供,该种行为显然已经违反搜索引擎服务行业公认的商业道德。
对于非搜索引擎爬虫,如前所述其单纯就是把别人的数据拿过来为其所用,在这种情况下,未经许可扒取别人数据的行为显然比搜索引擎爬虫的恶性要更大,所以举轻以明重,其违反Robots协议的扒取行为显然也应该构成侵权。在这里也列举了几个案子,对于非搜索引擎爬虫来讲,一方面违反网站的robots协议扒取网站的内容构成侵权,另一方面如果情节严重,还可能构成犯罪。
· 今日头条vs新浪微博案[11]
法院认为,搜索引擎是给被搜网站带来流量和利益,而非搜索引擎的网络机器人往往不是给被搜网站带来流量,反而可能带走被搜网站的流量……网站经营者对数据的收集、整理等基本都付出了相应的人力、物力、财力和时间等经营成本。robots协议在某种意义上已经成为维系企业核心竞争力,维系市场有序竞争的一种手段。
· 新浪微博vs超级星饭团案[12]
法院认为,第四,根据微梦公司提交的新浪微博Robots协议,以及双方均认可Robots协议可以约束包括网络爬虫在内的机器人之事实,云智联公司在明知微梦公司限制除白名单以外的机器人抓取涉案数据的情况下仍然实施抓取涉案数据中的公开数据,显然亦具有明显的主观恶意……第六,对于涉案数据中的公开部分,正常情况下,新浪微博用户可随时选择修改或删除相关数据,微梦公司基于其与用户之间的协议亦应维护用户处理其数据之权利;但云智联公司的抓取和展示涉案数据的行为会使这部分数据脱离用户自身和微梦公司的控制,减损其处理数据的权利。
另外还有一点值得讨论,现在有一些网站是没有设置Robots协议的,那么对于非搜索引擎爬虫来讲,其是否可以直接爬取网站数据?我们认为还是不可以的,就像上述的举例,即使没有在家门口立警示牌,其他人也仍然不能到别人家中拿走东西,这是一个非常朴素的道理。
三、数据垄断法律判断
当前大家还有一个疑虑,对于平台数据进行强保护,会不会产生数据垄断的问题,这也是行业对于数据保护的担忧。
(一)什么是数据垄断?
典型的数据垄断应指某类数据的收集、处理渠道被个别平台控制,其他平台无法通过自身合法经营获取、处理同类数据。数据是一种资源,一种生产资料,来源于用户,如果将数据、用户比作一座矿山,那么如果矿山本身是开放的,每个平台通往矿山的通道是畅通的,矿山没有被任何一个主体圈起来予以禁止,那么在这种情况下每个平台都可以通过各自的方式来挖矿,就不存在数据垄断的问题。
如果某类数据的收集、处理被特定主体控制,其他主体无法自由获取、处理,那么可能属于典型的数据垄断,例如房屋登记数据、机动车牌登记数据等。而社交相关数据的收集渠道完全畅通,任何平台均可通过提供平台服务依法向用户直接收集,不具有垄断性质。
(二)数据垄断应依法严格判定
对数据权益保护当然可以进行反垄断法规制,但数据垄断的界定要以保护和尊重企业对平台数据的合法权益为前提。在判断数据垄断的过程中,并非平台大、数据多就自然构成垄断,数据垄断是一个严格的法律问题,要在反垄断法的框架下按照垄断的各个构成要素逐一进行分析,包括相关市场的认定、支配地位的认定、滥用行为的认定以及被诉行为是否会对相关市场的竞争产生排除和限制等。
以上就是我想跟大家分享的内容,不当之处希望得到大家的指正。
注释:
1.参见(2016)京73民终588号民事判决。
2.参见(2016)沪73民终242号民事判决。
3.参见(2017)京0108民初24530号民事判决。
4.参见(2018)浙01民终7312号民事判决。
5.参见(2021)京73民终1011号民事判决。
6.参见(2016)京73民终588号民事判决。
7.参见(2018)浙01民终7312号民事判决。
8.参见(2017)粤03民初822号民事判决。
9.参见(2013)一中民初字第2668号民事判决。
10.参见(2020)粤0106民初39182号民事判决。
11.参见(2021)京民终281号民事判决。
12.参见(2017)京0108民初24512号民事判决。