作者: 陈兵 南开大学竞争法研究中心主任,法学院副院长
当前,数据成为数字经济发展的关键要素。随着数据产业和数据资源现实交易的迅速发展,企业之间因数据收集、处理、利用而引起的法律纠纷不断涌现,数据资源的财产权利和商业交易关系法律保护需求日益迫切。在已有的法律制度框架下,数据产权的知识产权保护模式和路径亟需进一步交流和研究。有鉴于此,由四川大学法学院创新与竞争法研究中心、天府知识产权研究院联合主办、知产财经协办的“数据不正当竞争法律实务问题”研讨会于9月16日在成都召开。南开大学竞争法研究中心主任、法学院副院长陈兵围绕“数据不正当竞争认定规则的司法实践”话题进行主题演讲,知产财经对其主讲内容进行了整理,以飨读者。
陈兵 南开大学竞争法研究中心主任,法学院副院长
一、提出问题
(一)时代背景
数据作为重要的生产要素已经成为兵家必争之地。在数字化时代,数据不再仅仅是信息的收集和储存,而是一种无可替代的资源,具有巨大的经济战略价值。
2022年12月19日,国务院正式发布《数据二十条》,标志着我国数据要素市场化发展及规范化治理将进入一个新阶段。《数据二十条》在数据流通和交易、数据权益分配和数据治理等方面都提出了相应的意见、方案及措施,为推动数据要素参与市场化配置提供指南。
(二)数据纠纷
商业数据作为企业的关键生产要素,已成为各大企业获取竞争优势的战略资源。实践中,围绕数据的爬取与反爬取,爬取后数据的合理使用,以及OpenAPI开发合作模式中的授权使用原则等问题都发生了不正当竞争纠纷。明晰数据不正当竞争的认定规则在司法实践中日趋重要。
二、规则丰富
第二部分涉及重点规则的分布,这在我的理解范围内是比较客观的。目前从数据领域反不正当竞争的几个典型案例中可以提炼出相应规则,当然不能用一个案子来树立一个规则,但其反映出一种倾向,可以和大家分享。
(一)限制搜索引擎抓取应有行业公认合理的正当理由
对于robots协议的设计应当考虑合理正当的理由。如何认定合理正当可能还需要进一步细化。早期在1.0时代的信息简单获取,到2.0时代人机互动的读写,再到3.0时代以用户为中心,以云、内容、算力为基础的去中心化的数据产品,包括数字人等,robots协议也面临一些调整。
· 奇某公司诉百某公司不正当竞争纠纷案
一审裁判要旨:“奇某公司的3**搜索引擎属于通用搜索引擎,而通用搜索引擎的网络机器人进入一个对公众开放的网站抓取信息通常并不会损害网站的利益,反而有利于其宣传推广。”
二审裁判要旨:“可以将互联网行业协会组织其会员起草并签署的行业自律公约的相关约定作为认定互联网行业惯常行为标准和公认商业道德的参考依据。综合考量被告给经营者利益、消费者利益、竞争秩序带来的影响后,构成违反商业道德的不正当竞争行为。”
(二)判断限制非搜索引擎抓取行为的正当性需保护经营者自主权与多元利益的平衡
· 字某跳动公司与微某创科公司不正当竞争纠纷案
裁判要旨:“搜索引擎是给被搜网站带来流量和利益,而非搜索引擎的网络机器人往往不是给被搜网站带来流量,反而可能带走被搜网站的流量。由于非搜索引擎场景应用的网络机器人区别于搜索引擎,以及受互联网互联、互通、共享、开放精神的影响,因而《互联网搜索引擎服务自律公约》仅可作为搜索引擎服务行业的商业道德,而不能成为互联网行业通行的商业道德。”
在不损害消费者利益、公共利益以及竞争秩序的情况下,应当允许网站经营者通过robots协议对其他网络机器人的抓取进行限制,这是网站经营者经营自主权的一种体现。
数据本身还是应该有一定区分,所以此次反法修改加入商业数据条款。实际上公开数据不等于公共数据,数据本身的价值是因为流动而产生。信息跟数据的区别是什么?如果将数据作为一种信息来对待,数据作为信息的底层,信息从数据中提炼出来,这个时候数据作为一个狭义资产,其保护条款应该是什么?如果用商业条款来保护数据,不如说是用商业条款来保护数据中存在的一种公司信息,这样就区分了数据和信息。在这种情况下,数据以公开的形式存在,其本身也是数据价值实现的一种载体,公开的数据公开了什么?如果数据公开后要进行赋权,知识产权可能会解决这个问题。这只是一个观点,也就是数据要不要保护,应给予什么程度的保护问题。
在重庆有一个企业,利用公开数据对另一个企业进行了评判,后面进行了赔偿。它利用公开数据制作了一个评价,需要承担责任,为什么在它要承担责任时,利益却不能享有?这也是一个悖论。在什么情况下,它的正当性需要平衡到经营者的自主权和多元利益?都是值得研究的。
(三)抓取后数据的使用不可超出“必要的限度”
· 汉波涛公司与百某公司不正当竞争纠纷案
裁判要旨:“Robots协议只涉及搜索引擎抓取网站信息的行为是否符合公认的行业准则的问题,不能解决搜索引擎抓取网站信息后的使用行为是否合法的问题。”
在使用来自搜索引擎抓取的信息时,理想状态下应当遵循“最少、必要”的原则,即采取网站所在公司损害最小的措施。如果存在明显损害方式更小的方式而未采取,或者其欲实现的积极效果会严重损害网站利益的情况下,则可认定为使用方式已超过必要的限度。
(四)OpenAPI开发合作需遵守三重授权原则
裁判要旨:“新某微博在实施开放平台战略中,有条件的向开发者应用提供用户信息,坚持‘用户授权’+‘新浪授权’+‘用户授权’的三重授权原则,在保护用户隐私同时维护企业自身的核心竞争优势。淘某公司违反《开发者协议》,未经用户同意且未经被微某公司授权,获取新某微博用户的相关信息并展示,侵害了微某公司的商业资源,构成不正当竞争。”
但这个案子提到了是否要进行三重授权。我们在API的开源过程中,需要遵守三重授权,接下来会不会有所改变?进入web3.0时代,在去中心化平台的场景下是否会改变?我觉得可能需要在技术上以及实践中进一步提出。
(五)区分数据抓取行为与使用行为的正当性认定标准,构建数据权益动态赋权制度,促进数据安全合法流动
· 天津某数码公司诉上海某公司数据不正当竞争纠纷案
裁判要旨:“数据的价值在于流通,通过对原始数据的加工创造出的衍生数据产品,从而创造数据的再生价值,推动社会经济与行业的整体进步。”
整体搬运涉案数据并直接用于涉案产品的新闻栏目中的行为,既非实现涉案产品正常运营的必要手段,亦不符合社会公共利益的价值需求,其所实现的效果并不足以弥补被诉行为造成的损失,影响正常的市场竞争秩序和健康公平的行业生态,降低消费者福利,超出数据利用的合理限度,构成不正当竞争。
天津法院在审判时考虑到,其抓取量不大,那么抓取行为到底违不违法?我们把数据行为分阶段,包括数据获取、使用、交易、竞争等,是一系列的行为。数据行为的合理性或者数据利用的合理限制,如果没有robots协议,也没有约定,抓取数据是否就一定违法?天津自贸法院进行了一个探索,但当时并没有对此做出定论,因为其认为数据的价值在于流动。问题在于这并不是经营的必要手段。换句话说,如果是必要手段,如果能符合公共利益又将如何?所以留了一个缺口,并不会完全去否定前面的获取,对获取行为有一个合法性的认定,或者说会联合数据应用的整体行为去判断。这里还有很多空间来看待数据抓取行为。
三、创新抗辩
从学术引入的角度来看,我希望能对未来有准确的预判,现在robots协议还能否适用十年前在web1.0时代的robots协议,还能否适应现在从2.0到3.0过渡阶段的数据权益保护问题?其重要性不言而喻。尤其在数据二十条发布之后,从对数据资源的持有,到对数据的加工使用,以及数据产品的经营权都提出了一些新的方向性指导,包括今年两会国家数据局的设立,可能下一步都会对司法裁判产生一些影响。
司法裁判一定要跟国家的大政方针同步同频。否则,会导致一个接受度的问题;第二是对于产业发展的影响。个案可能会产生一种风向,对投资主体、产业发展等都会产生重大影响。尤其对于新兴领域,要稳一稳、缓一缓。
上述柱状图是整个涉网的纠纷案例,不仅仅是涉数据。大家可以看到一个大致的走向,2017年互联网管理条例实施之后案件数量突然有一个下降趋势,到了2021年时开始上升,2022年时又有一个回落,这可能还是与司法判决有关系。2023年还未统计,可能最近有一些案件会陆续出来。
作为一个经营者,它是数据的原生企业还是数据增强企业,所谓的原生企业是指其生存就是以数据为原料。数据的增强企业是说数据可以增强它的竞争力,它自己去获取,或者在没有较多数据的情况下也可以经营,只不过经营时会比较困难。我们在考虑数据权益时要考虑到它的整个环节,要给予必要的成本和可预期的、充分的填补和合理的回报。希望法院在思维方式、判决结果方面能够有所调整,因为当前对反法和知产的保护都已经有了明确的区分。
关于创新抗辩,具体而言要关注以下两个问题:
(一)数据动态赋权
机器人爬虫技术通过全网抓取已成为数据企业获取生产原料的主要方式。数据机器化获取行为提高数据获得效率、降低数据使用成本、增进数据流通速率、释放数据价值,具有合理性与合法性。应将数据获取行为正当性的判断与数据动态创新所带来的价值一并考量,而非简单地以数据静态赋权的方式判断数据爬取行为的当然违法性。
(二)数据利用的合理限度
1、实现数据安全合法流动所必需的行为及成本的合理分配;
2、赋予数据企业在数据采集、使用、存储、流通、交易等各环节中所付出的必要成本和可预期收益的充分填补与合理回报;
3、规范与激励数据企业合理使用数据,多维度、全流程地细化和优化数据行为正当性识别标准。
最后希望能对数据企业的合理使用进行多维度、全流程的细化和优化。
(本文仅代表作者观点,不代表知产财经立场)
查看更多知识产权精彩内容,请浏览知产财经官网:www.ipeconomy.cn