作者:杨德嘉 北京市海淀区人民法院民五庭庭长
数据是数字经济发展的关键要素,更逐渐成为国家重要的战略性资源。去年年底,国务院专门发布《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》,提出了20条政策举措,包括建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度等。将数据作为新兴生产要素,已经成为我国的政策选择。
在司法实践中,涉及数据不正当竞争的相关案件也在逐年增多。今年4.26期间,包括广东高院、浙江高院、海淀法院、浦东法院等多家法院评选出多件数据相关的知识产权典型案例,旨在为审理类似案件提供相关参照标准。随着案件数量的增加以及案件越发具有复杂性、多样性等特点,对于如何合理划分数据权益权属及边界,妥善审理数据确权、交易、服务、隐私保护等案件,如何引导经营者通过技术创新等方式形成良性竞争,净化市场环境,激发市场活力,规范市场秩序等内容均值得深入探讨。基于此,由中国政法大学数据法治实验室与知产财经全媒体联合主办的“首届数据权益保护实务论坛”于5月27日在北京召开。会议邀请了来自学术界、司法界、产业界等代表围绕数据权益相关话题展开交流和研讨。会上,北京市海淀区人民法院民五庭庭长杨德嘉进行主题演讲,知产财经对其主讲内容进行了整理,以飨读者。以下是其演讲实录。
杨德嘉 北京市海淀区人民法院民五庭庭长
非常高兴有这个机会向各位专家、同仁汇报一下近期的学习和研究过程当中的一些思考。
当今,我们经常把数据比喻成新时代的石油。这个说法,我个人能够追溯到的最早出处,是2006年的时候,英国的一个数学家Clive Humby提出来的。《经济学人》杂志在2017年专门将数据问题作为一期封面主题,不仅提出数据是世界上最有价值的资源,同时也提到了数据与新的竞争规则问题。
数据作为新的生产要素,在数字经济与互联网环境下的重要性是不言而喻的,同时也与网络竞争紧密联系在了一起。从近年来相关法律、法规、地方规章等的制定和实施方面,就不难看出各个层面对数据的重视。不少地方甚至已经开始了数据登记、确权、交易等各方面的尝试。有关国外相关情况的报道,我们也经常可以看到。例如,随着AI生成内容在全球范围受关注程度越来越高,一些拥有数据的网络平台开始表示出不满:我的数据每天都被爬取用于训练AI,但训练出的成果却是由别人享有的。部分平台已经开始拒绝或限制对其数据的免费获取,进而公开提出要对其数据访问定价。由于各方围绕着数据所提出的种种构想和尝试都还处在探索的起步阶段,市场和规则的最终走向会是什么样子,我们目前恐怕还很难看得非常具体和清晰。但是,把数据作为市场主体的重要经营资源,并且尝试在市场中探寻相应的交易规则和交易价格,这可能是一个不可避免的趋势。
因此,我今天所分享的内容,也主要是围绕着有关数据爬取以及后续使用所引发的纠纷,并谈谈对几个相关问题的思考。我简单梳理了一下近年来的典型案件,这里列出了其中的一部分。当然,国内的典型案件远不限于这些。而国外的案件,受到关注和研究比较多的就是HiQ Labs诉Linkin这个案子。
图:因数据爬取及后续使用引发的市场经营者之间的纠纷
这里首先需要关注的一个问题是:当我们在讨论数据时,我们讨论的对象到底是什么?在网上随手一查便不难发现,实际上在很多场景下,大家在讨论数据或信息的问题时,把它们二者混同在一起,不作明确区分的。包括很多资料中对数据和信息的定义,也存在这样的情况。在不同的专业领域,信息与数据二者之间到底是什么样的关系,它们的区别又有哪些?我们得到的答案似乎也不尽相同。
比如说,什么是信息?有的地方给出的定义是:“指一种描述事实或事件的数据、事实或知识,可以被传递、存储、处理和使用……可以是文字、声音、图像、视频或任何其他形式的数据。”有的地方给出的答案是:“指事物发出的消息、指令、数据、符号等所包含的内容……”那什么是数据呢?有些网络资源给出的解释是:“指原始的、未经处理的数字、符号或者文字等……需要经过处理、解释和分析才能转化成有用的信息。”数据与信息是什么关系?我们查到的结果很可能是这样的:“信息则是对数据的解释和理解,是从数据中提取出的有用的,有意义的内容……数据是信息的基础,信息则是从数据中提取出来的有用内容。”所以,从以上信息与数据的概念和定义情况看,似乎普遍存在着相互解释、相互说明的现象。这当然是二者之间具有密切联系所导致的,但与此同时,我们也必须准确把握二者之间的本质区别。举例来看,这几篇文章的标题《欧盟拟要求云服务数据在欧盟存储和处理,亚马逊、谷歌、微软等受波及》《2022年度法律法规公布及应用情况数据分析报告》《春天真有那么短?丨数据告诉你》,尽管都用到了“数据”这个概念,但所指内涵和外延恐怕是不一样的。尽管在日常生活中,即使混用信息与数据的概念,也并不会在理解方面给大家造成明显的困扰。但在法律问题的研究和分析方面,二者的混淆就很可能导致根本性的分歧。
从现行法律的规定看,《民法典》第一百二十七条规定虽然提及了数据,即“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,但仅是一个非常原则性、宣示性的条款。比较直接和明确作出规定的是《数据安全法》,第三条指出:本法所称数据,是指任何以电子或者其他方式对信息的记录。值得注意的是,这里的“记录”是作为名词而不是动词出现的,指的对信息进行记录的那个结果或者说是载体。很多专家学者,也都认识到了区分信息与数据的重要性,像中国政法大学时建中教授、对外经济贸易大学梅夏英教授、清华大学申卫星教授等专家,都曾就此专门撰写文章,从多个角度进行过剖析。例如申卫星教授在他的《论数据用益权》一文中就指出:“数据的本质是信息的载体,而信息是知识来源……数字经济时代,数据应是对已知或者未知信息 (连同元数据)的数字描述,且在技术上能够成为数字运算(处理、存储与传输)的对象,是以可机读方式存在的电子化信息记录……要正确讨论数据权属问题,必须从客体上严格区分数据和信息,将二者混为一谈会产生许多不必要的误解……”
回到我们今天所谈的网络平台数据竞争这个具体的场景下,对数据和信息加以明确区分,就具有更加重要的意义。就我个人的理解而言,甚至可以将这里所指的数据进一步明确为“作为信息载体的电子数据”。如此一来,有助于我们对很多问题加以澄清,为深入地探讨打好基础。
例如,基于前面所述的那个将数据比喻为石油的提法,有些人就会进一步认为,既然数据与石油一样,那么就都属于自然资源,那么大家就都有权去自由地获取、开发和使用。首先,这种观点混淆了不同状态下、不同性质的石油:是在海底、岩层下未经开采的石油,还是从油井中开采出来已经装桶的原油产品,亦或是经石油加工而成的汽油等商品?尽管都是源自作为自然资源的石油,但随着开采、提炼等投入和加工程序,显然它们的性质、特别是商品属性已经发生了本质变化。其次,以此来简单地套用数据的属性,也有过于简单粗暴之嫌。况且,从前述数据的概念以及其与信息的关系看,我们应当认识到,这里所说的数据根本不可能具有与自然资源一样的天然属性,它毫无例外地是经过收集、存储、使用、加工、传输、提供、公开等人为处理之后的产物。或者我们也可以这样理解网络平台竞争语境下的数据:它即便是水,也并非是江河湖海中流淌着的天然水,而是被加工、过滤、包装之后,摆在超市货架上的作为商品的饮用水。
信息可以有各种形式,有的信息可以构成作品,有的不能构成作品。对于能够构成作品的信息而言,其与对应的数据之间的关系,就相当于我们此前所理解的作品与载体之间的关系,就是小说与图书、歌曲与唱片、画作与画布之间的关系。在此基础上,我们不难认识到:同样的信息是可以对应着不同的数据的,同时也可以对应着不同的数据持有者或控制者;而这些数据的持有者和控制者,对于各自所持有、控制的数据分别、单独享有着并存不悖的权利。在此情况下,即使某一主体控制着某些数据,也并不代表着其就必然控制了相应的信息。比如说,我的书架上摆着一套《红楼梦》的书,这是任何人未经许可不能拿走的,但是我对作为载体的书的控制,并不会影响甚至阻碍《红楼梦》这部作品的传播。值得进一步思考的是,当我们在互联网领域提倡“共享”“流通”时,我们所指的对象,究竟应当是信息,还是作为其载体的电子数据?哪一个才具有正当性、必要性、合理性?
在区分信息和数据的前提下,很多概念之间的边界自然也就变得清晰了。例如,公开信息与公开数据是不能够划等号的。除此之外,还有一些概念需要大家注意加以区分,比如说:公开数据不等于共同数据,尽管只有一字之差,但具有本质上的不同;对信息或数据的公开提供并不等于一定就是免费提供,也不等于一定就是无条件地向互联网上的所有主体提供,也不代表任何主体获取了这些信息或数据以后就能够以任何方式对这些数据进行使用。
最后,对于平台数据的爬取和使用的规则,尽管我们可以从不同的角度,引入不同的理论去进行探讨,但恐怕都不能背离基本的原则和常识。
举例来讲:如果我家门前有两棵树,一棵是枣树,另外一棵也是枣树;但一棵在院墙里,一棵在院墙外;两棵树长得一模一样,都结满了枣。作为一个路人,常识会告诉你:院墙外的那棵树上的枣,你或许可以不经许可,摘下来就吃;而院墙内那棵树上的枣,不经主人的许可,翻过墙去摘,肯定是不对的。此时的主人,是无需出具任何证据,就有权要求你停止翻墙摘枣,乃至进行赔偿的。这,就是原则。但如果你在摘墙外那棵树上的枣时,主人出来阻止你,说“这是我们家的枣,你不能吃”,那么你是有理由要求他作出合理解释并加以证明的:路边的枣树,凭什么说是你的财产,受你的控制?同理,如果换成是院墙里的那棵树,而你非要理直气壮地去摘,那么就需要你有充分的证据证明它并不属于房主,而是属于他人的或者公共的财产。这,就是例外,而例外是需要被证明的。
如果我们把两棵枣树替换成不同领域、不同类型、不同状态的数据;把院墙替换成用户协议、robots协议、保护数据的技术措施等;把主人和路人替换成数据的持有者和潜在的爬取者、利用者……那么以上情况所涉及到的规则,难道就不成立、不适用了吗?
一旦进入网络世界,人和人的相互关系、行为准则、权利义务等等,真的会发生颠覆性的、根本性的变化吗?我们真的有必要去打破、甚至是背离原有的规则和共识,去重塑一套行为规范吗?我对此是深表怀疑的。当然,怎么样去科学地拓展现有的规则,使之更全面地延伸到网络环境,更好地适用于网络行为,我们可以继续去研究和探索。但人们以往长期的生活中,逐步形成和认可的,这些基本的常识、规则,以及最起码的行为边界,即使进入到了数字时代和网络环境,也还是具有现实意义的。
以上是我的分享,谢谢大家!