作者:申卫星(清华大学法学院教授,法学博士)
出处:《比较法研究》2024年第4期
目次
一、问题的提出
二、数据来源者的概念界定
三、数据来源者赋权的正当性
四、数据来源者权的具体构造
五、结语
摘要:数据来源者是数据的初始生成者,即在数据生成过程中通过劳动、成本投入或其他形式引发数据从无到有的主体,包括自然人、法人、非法人组织、国家。数据来源者不同于信息来源者,信息来源者是数据承载信息所描述的对象,信息来源者并未直接参与数据产生的过程,也未向数据持有者提供数据,故其对于承载相关信息的数据并没有财产性权利。就数据来源者的权利构造而言,基于数据复用、收益孳息、数字劳动理论,数据来源者对其生成的数据享有数据所有权,具体内容包括数据访问权、数据使用权、数据收益权。
关键词:数据来源者权;用户权;数据访问权;数据使用权;数据收益权
01 问题的提出
数据产权分配中,围绕着数据采集、存储、传输、加工、分析和使用等多个环节,有诸多的数据参与者。而这些不同的参与者主要可以分为两类:一是数据来源者,二是数据处理者,前者是数据的供给者,后者是数据处理行为的操盘手。《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“《数据二十条》”)在区分数据来源者和数据处理者的基础上,确立了要充分保护数据来源者权益的基本立场,明确规定“充分保护数据来源者合法权益,推动基于知情同意或存在法定事由的数据流通使用模式,保障数据来源者享有获取或复制转移由其促成产生数据的权益”。对这一具体要求的理解,是构建我国数据产权制度的关键和逻辑起点。
从目前学界的研究来看,学术讨论多聚焦于数据处理者的数据权利,而对数据来源者的研究相对薄弱。在“数据来源者”这一概念被中央政策文件正式采纳后,我国已有学者明确建议,未来我国立法应当明确承认数据来源者的权利。然而,要在立法层面确立数据来源者权利,仍存在如下核心问题需要解决:(1)何为数据来源者,谁有资格成为数据来源者?其是指数据所载信息的来源者,还是指数据的初始生产者?(2)数据来源者为何能够享有数据权利,其享有数据权利的正当性基础是什么?(3)数据来源者对哪些数据享有权利,以及享有何种权利?是应当建立一种具有普适性和统一性的数据来源者权,还是应当区分不同来源者类型建立差异化的数据来源者权利体系?笔者围绕以上问题,展开本文论述。
02 数据来源者的概念界定
(一)数据来源者的界定:数据来源者还是信息来源者?
“数据来源者”是一个尚未确定的法律概念。数据不能凭空产生,其必然存在某种来源。虽然可以笼统地说数据来源者是数据的“源头”,但源头会因参照系的不同而产生差异。如果我们将参照系定位于从信息产生到数据生成这一全过程来追本溯源,数据来源者应当指的是信息产生者;如果将参照系缩小,着眼于数据从无到有的过程,则数据来源者应当指的是数据最初的生产者。故此,在界定数据来源者权利时,首先应当明确,我们是在哪个层面上讨论数据来源者?对此,有如下不同的观点。第一种观点将数据来源者定义为信息来源者。如高富平教授指出,数据来源者指的是数据所描述的对象,数据来源者本身并没有发挥其主观能动性来创设数据,只是数据的信息源头;只有那些将数据来源者信息以数据形式记录下来的,才能称为数据生产者。根据数据信息来源的不同,数据大致可分为个人数据、组织数据和物体数据。王利明教授明确指出,严格来说,所谓“数据来源者”应当被称为“信息来源主体”,即对数据的产生提供了一定的信息的主体,虽然信息来源主体对数据的产生作出了一定程度的贡献,但是不能说信息来源主体提供了数据。
第二种观点认为,数据来源者包含信息来源者和数据初始生成者两种类型,信息来源者和数据初始生成者都可以享有相应的数据权利。2021年9月27日,欧洲法学会成员大会审议通过《美国法学会、欧洲法学会数据经济原则》(ALI-ELI Principles for a Data Economy: Data Transactions and Data Rights)。该原则第18条第1款规定:“在确定数据是否以及在何种程度上应被视为共生数据(co-generated data)时,应优先考虑以下因素:(a)该方在编码数据中是信息的主体,或者该信息主体的资产的所有人或经营者的程度;(b)数据是否由该方的活动产生,或者通过该方拥有或经营的产品或服务使用产生的程度;(c)数据是否由该方以创造新质量的方式收集或汇集的程度;以及(d)数据是否由该方制作或开发的计算机程序或产品或服务的其他相关元素使用产生的程度。”依此观点,信息来源者和数据初始生成者对数据生成均有贡献,均可以享有一定的数据权利。
第三种观点将数据来源者界定为初始的数据生产者。笔者曾用“数据原发者”的概念来指称数据来源者,想表达的就是,所谓数据原发者即使数据从无到有得以产生的创造者。例如,如果所采集的数据源于自然人用户,如自然人的网络接入行为所产生的上网记录、行踪轨迹等,那么此时自然人用户即是数据的来源者。企业也可以成为数据的来源者,如企业数据经营行为产生的数据。至于国家作为数据的来源者,是针对那些存储国家公共信息的数据,如存储地位置信息的数据、气候信息的数据等,这些数据是国家资源,其来源者身份是基于国家的主体地位。冯晓青教授指出:“从最严格的意义上说,数据资源直接来自于原始数据,原始数据产权构架是数据资源产权的核心内容。原始数据来源者是最初的数据生产者。”总之,数据来源者被界定为数据的初始生成者,即引发数据从无到有得以产生的主体。
欧盟委员会于2022年3月发布的《数据法:关于公平访问和利用数据的统一规则的条例提案》,将用户权利规定为一种法定权利,详细规定了用户有关知情同意、访问、转移其数据的相关权利。2023年11月,欧洲议会正式通过《关于公平访问和使用数据的统一规则的条例》(Regulation on Harmonized Rules on Fair Access to and Use of Data)(Data Act,以下简称“《数据法》”)。从比较法上看,欧盟《数据法》一定程度上采取了第三种路径。欧盟《数据法》中的用户并非指信息来源者,而是指数据的初始生成者。该法中“用户”(user, Nutzer)的概念受到我国学者的重视。然而,欧盟《数据法》中的“用户”不同于我国学者所言的信息来源者。欧盟《数据法》所强调的用户身份,是其作为智能设备所有者或使用者,在数据生成过程中的初始生产者(直接生产者)身份(Nutzer als unmittelbarem Erzeuger)。因此,《数据法》的用户更接近于数据的初始生成者,而与我国学者所定义的信息来源者存在着显著差异。
至此可知,关于数据来源者的界定,争议焦点在于其究竟是信息来源者,还是数据的初始生产者,抑或二者的结合?我们在将《数据二十条》所确立的“数据来源者”这一政策语言法律化的过程中,应当采哪种标准进行界定,是我们构建数据来源者权利制度时面临的根本性问题。
(二)数据来源者与信息来源者的区分
将数据来源者界定为信息来源者的做法,混淆了数据与信息的关系。诚然,数据和信息确实结合得非常紧密,但是正如分子还可以细分为原子,原子还可分为电子、质子、中子一样,各部分之间联系无论多么紧密,仍有区别的可能和必要。信息和数据的区别在于:信息的功用在于消除人们认识上的不确定性,它是一种体现语义的信息,位于内容层;而数据是对信息内容进行记录的句法信息,是信息的载体。可以说,信息与数据之间彼此依存且互为依托,但并不因其紧密结合而不可区分。这一结论意味着,数据产权关注的是数据的控制和使用,不涉及对信息内容的独占。美国学者詹姆斯·格里梅尔曼和克里斯蒂娜·穆利根指出,数据产权人可以持有、使用、收益、处分数据,但此种数据产权并不赋予权利人对数据所承载的信息的权利。换言之,如果其他人也合法拥有信息内容相同的数据,那么他们可以自由使用而不受其他数据产权人的限制。
在数据与信息相互区隔的背景下,二者之上所成立的权利是各自独立的,对(个人)信息拥有的人格权并不能替代存储信息的数据产权。数据产权是一种财产权,“私有产权的决定性特征是,所有者有权不让他人被动拥有和积极使用该财产,并有权获得使用该财产时所产生的收益”。就信息来源者来说,数据之上承载的信息内容已经存在相应制度予以保护。例如,数据上承载的个人信息、智力成果等信息内容的权益当然可以由我国民法典、个人信息保护法、著作权法等相关法律进行确认与保护。但存储这些信息的数据产权,确是(个人)信息权益所无法承受之重。
将数据来源者泛化为信息来源者,还会影响通常的数字经济行为。例如当数据源于建筑物信息时,如果承认建筑物所有者的来源者身份,那么,当高德等企业收集城市空间的建筑物外观信息以绘制地图时,就需要征得建筑物所有者的知情同意,或者需要为其提供访问与转移权,在此情形下,不仅数字地图无法制成,还将产生高昂的数据治理成本,影响数据的流通与利用。又如,房屋外观、院子里的花草树木等美观信息被路人分享,只要路人不侵犯房屋或院子主人的隐私,就不必向对方支付费用。如果此类信息的获取行为被认定为违法,则社会中人人皆是违法者。可见,在被动记录的情境下,信息来源者仅仅是提供了信息,并未直接参与数据产生的过程,也未向数据持有者提供数据。在这种情况下,信息来源者只能依据个人信息权、隐私权、商业秘密等在先权利,对数据拥有一定的消极防御权利。德国学者迈克尔·多纳也强调:“总而言之,上述法律领域的数据只能间接地或通过防御权得到保护,保护的前提在于存在违法行为。相比之下,超出这个范围的、与数据本身有关的权利,需要采取相应的立法措施才能解决,而现行法有关信息权利的保护规则无法提供答案。”
就数据产权的配置而言,将数据来源者界定为数据初始生成者更有意义。比如,在平台经济领域,用户通过浏览网页、发布评论等行为,在网络平台上产生了大量的数据。在数据生成过程中,用户不仅投入了数字劳动,还作出了经济投入,比如购买手机、支付网络费用等。鉴于用户对数据生成作出的贡献,应当赋予其一定的数据产权。因此,用户对其自主生成的数据不仅享有人格性权利,还有权控制数据的使用和分享,以及从数据的利用中获取相应的经济利益。故此,所谓数据来源者,应当是指那些通过劳动、投资或其他形式的积极贡献,使得数据得以从无到有产生的主体。只有当数据来源者对数据的生成做出了实质性的贡献,才有必要考虑赋予他们一定范围内的数据产权,尤其是那些财产性权利。
需要说明的是,不能将数据的初始生成者狭义地理解为技术上的生成主体,而应当从广义上理解,只要该数据是由该主体的活动产生的(如企业经营行为引发的数据),或通过使用该主体所有或运营的产品或服务而产生的(如用户使用智能穿戴设备产生的数据),该主体就可以被视为数据来源者。我国有学者从技术角度对数据生产行为作狭义解释:“数据生产即数据采集——通过技术手段将特定对象本身及其行为或过程以数字形式记录下来,形成用0和1记录的数据。”依此观点,作为记录者的网络平台才算作数据生产者,用户只能算作被记录者,而非数据生产者。该观点一定程度忽视了数据来源者在数据生成过程中亦作出劳动贡献和经济投入,而非对数据生成毫无贡献。
因此,在界定法律意义上的数据生成行为时,应当与技术领域的数据生成概念相区分。《美国法学会、欧洲法学会数据经济原则》的起草者指出,数据生成作为一个规范性的法律概念,与技术领域的数据生成并不一致,法律上的数据生成概念要比其技术概念更加宽泛。从技术角度来看,数据生产者仅指那些通过输入信息产生数据的主体,但法律应当采取更广泛的视角,一方对数据生成的另一种贡献形式是该方通过某种方式进行活动,从而生成了数据(例如,该方驾驶了一辆智能汽车)或者拥有或经营生成数据的设备(例如,该方拥有生成数据的机器)。欧盟《数据法》的立法者在序言中也采取了广义的数据生成概念:“用户使用互联产品或相关服务产生的数据,应被理解为包括有意记录的数据或用户行为间接产生的数据,如有关互联产品环境或交互的数据。”
值得注意的是,数据来源者虽然作为数据的最初生产者,但其生成的数据往往由数据处理者持有。如在电商平台上,网络店铺通过经营销售所产生的营销数据,实际上由平台直接持有并控制。网络店铺要想将数据从一家平台转移到另一家平台或者第三方平台进行汇聚和分析,通常会遭到平台拒绝。此种不公平局面也是数据来源者赋权的理据之一,为了对抗作为强势方的平台企业,赋予数据来源者以数据访问和使用权可以避免数据垄断。此外,对于用户生成的数据,如用户对网络店铺的评价、收藏、购买记录等,用户则是这些数据的来源者,其产权应当归属于用户,平台和店铺均应尊重用户的个人数据权利。
综上,数据来源者指的是数据初始生成者,即在数据生成过程中投入劳动和成本的自然人、法人、非法人组织、国家。在此基础上,自然人可以对投入劳动和成本的数据(不局限于个人数据)取得数据产权;企业特别是互联网平台企业可以对平台自主生成的数据取得数据产权;国家可以就公共数据取得数据产权。
03 数据来源者赋权的正当性
在界定数据来源者之后,需要探寻对数据来源者赋权的正当性并予以理论证成。就此,可以从数据复用、收益孳息、数字劳动三个维度入手,对数据来源者应当拥有数据所有权进行正当性论证。
(一)数据复用理论
向数据来源者赋权的第一点正当性理由在于,此种赋权模式可以有效克服“数据垄断”和“数据鸿沟”,最大程度地促进数据复用,从而提升社会整体福利。数据最大的特点在于其具有非竞争性,即数据可以在不影响其质量的情况下被多个主体同时使用,而相互之间不受影响。这种特性导致了数据具有规模收益递增的潜力,数据的广泛使用可以带来社会收益。例如,气象数据可以同时被农业部门用于指导农作物种植,被交通部门用于规划航线,被保险公司用于评估自然灾害风险。这些不同领域的主体对同一数据集的使用互不影响,而且每个新的使用都可能产生新的社会价值。因此,从产权配置的角度说,数据产权的配置应当能够最大程度促进数据复用,充分释放数据要素价值,从而提升社会整体福利。而非通过赋权使数据束之高阁,更不能因为赋权而阻碍了数据重复利用。由此产生的问题是,何种产权配置能够最大程度促进数据复用?
首先,将数据产权完全配置给企业不利于数据复用。实践中,企业一般都会通过技术手段来保护业务运营过程中产生的数据,免受第三方未经授权的访问或使用,构成对数据的事实排他性。在此背景下,将数据产权配置给企业会阻碍数据的流通利用。企业作为追求利润的主体,出于商业竞争和市场优势的考虑,会通过数据独占、设置数据壁垒等方式来保护自己的商业利益,从而阻碍数据的自由流通和复用。即便其他市场主体愿意支付合理费用,数据企业仍然倾向于独占数据以保持市场优势,而不是分享给其他竞争者。可见,将数据产权赋予给企业,并没有真正解决数据的流通问题,相反还会进一步强化数据控制者的权利,造成事实上的数据垄断,阻碍数据的自由流动。
申言之,即便将数据产权配置给企业,根据我国个人信息保护法之规定,企业要想重复使用个人数据,仍需征得用户同意,而用户在对复用目的和风险存在疑虑时,往往拒绝数据复用。以电商平台为例,假设该平台通过其在线购物服务收集了大量的用户个人数据,包括用户的购物习惯、支付信息、浏览历史等。该电商平台希望将收集到的用户数据用于新的业务目的,比如与第三方合作伙伴共享数据以提供个性化的广告服务。在这种情况下,即便数据产权在法律上配置给了企业,企业也不能随意复用这些数据,而是必须再次向用户明确说明数据的复用目的、使用范围、可能带来的风险,并且征得用户的同意。实践中,用户往往对于数据复用的安全性、隐私保护措施或者复用的目的存在疑虑,倾向于拒绝同意,由此导致企业无法按照原计划复用数据,从而限制了数据的流通和价值创造。
相比之下,将数据产权配置给用户才真正能够促进数据复用。美国学者琼斯和托内蒂指出,对于用户生成的数据,若将其产权配置给企业,则企业倾向于限制数据流通,以保持市场竞争优势,获取更高的利润。而将数据产权配置给用户能够最大程度促进数据复用,因为用户对自身的数据并没有垄断倾向,相反,用户更愿意在保护隐私的前提下,最大限度地使用其数据来使其数据经济利益最大化。这样可以充分发挥数据的非竞争性特点,可以实现数据利用率的最大化,从而提升社会整体福利。
举例来说,假设有一位消费者购买了健身追踪手环,并通过该手环记录了自己的运动数据、睡眠情况等数据。在传统情况下,这些数据可能由手环制造商控制。此时,公司可能会更倾向于将数据视为私有资产,以谋取自身利益,而不是将数据广泛共享以造福更多人。此外,如果公司拥有数据产权,则用户将无法控制数据,面临更大的数据泄露风险。基于此,即便公司想要将用户数据转让给第三方,用户也会因为担心个人隐私受到侵犯而不愿意分享数据,从而限制了数据的使用范围和潜在的社会效益。如果用户拥有这些数据的产权,情况则完全不同。基于数据产权,用户可以权衡个人隐私和经济收益之间的关系,进而决定以何种方式分享数据,以获得一定的经济回报,同时保护自己的隐私。这种平衡促使数据被广泛地使用,只要不侵犯个人隐私,用户往往乐于将这些数据出售给健康应用开发者、健身器材制造商或医疗研究机构等感兴趣的相关方。因此,将数据产权配置给用户可以促进数据的更广泛使用。
(二)收益孳息理论
对于用户在使用智能设备过程中生成的数据,我国既有研究在讨论这类数据的产权配置时,很大程度忽视了用户在购置、租赁智能设备时所作的经济投入。反观比较法,用户的经济投入从一开始就受到了域外学者的普遍重视,并将其作为数据产权配置的重要考量因素。虽然在数据生成过程中,企业作出很大贡献,但不可否认的是,数据从无到有的初始生产是在用户的智能设备中完成的。换言之,在原始数据生成阶段,用户通过购置、租赁等行为进行了经济投入,取得智能设备的所有权或使用权,用户通过使用这些设备所生成的数据,应当被视为用户从智能设备所有权或使用权中获得的收益,即权利孳息。
德国学者兰伯特·格罗斯科普夫(Grosskopf)指出,数据可以被视为《德国民法典》第99条第2款中所指的权利孳息(Rechtsfrüchte),就像狩猎权的孳息是猎物、水利用权的孳息是能源一样,车主驾驶汽车所生成的数据(如速度、油耗和目的地),应当作为车辆所有权的孳息归于车主。蔡希(Zech)也强调,用户通过智能设备产生的数据,应当被视为设备所有权的一种延伸;用户使用智能设备所产生数据,在性质上属于一种孳息(Frucht)或使用利益(Gebrauchsvorteil),故应当归属于用户,即设备所有者或租赁者。据此,用户对其使用设备所生成的数据享有所有权,即数据生产者权(Recht des Datenerzeugers)。
2017年,欧盟委员会发布了“构建欧洲数据经济”通讯,采纳了数据生产者权的概念,并将该权利赋予智能设备的所有者或长期用户。赋权的目的在于“为用户利用其数据提供可能性,从而有助于解除设备生成数据的锁定”。换言之,智能设备的所有者也应是该设备所产生数据的所有者,这是欧盟委员会提出数据生产者权利的基本理念。数据生产者权的客体范围还覆盖了不涉及特定个人的数据,比如企业的数字化运营过程同样会产生大量的数据,这些数据就不涉及个人数据保护的问题,根据前述归属规则,这些数据即归属于经济上负责运行产生数据的设备的企业。譬如电力企业应对其使用的传感器生成的物联网数据享有数据生产者权。
欧盟《数据法》的用户权利脱胎于数据生产者权。数据生产者权由于专有性过强而受到德国马普所专家的批判,《数据法》的立法者接受了这一意见,最后构建了以数据访问权为基础的用户权利制度。在这一意义上,用户权利是一种“弱化版”的数据生产者权,也被视为一种“受限的财产权”(limited rights in rem)。在欧盟《数据法》中,“用户”这一概念具有特定的含义,它指的是使用或购买联网产品或相关服务的个人或企业,用户对其使用产品或接受服务过程中产生的数据享有访问、使用、携带等权利,也被称为用户权利。从上述发展历程可知,用户权利只是一定程度上弱化了数据生产者权的排他性,但其赋权基础仍是基于用户的经济投入,将用户生成的数据视为该经济投入的一种收益回报。
因此,在我国的数据产权配置实践中,应当充分考虑到用户的经济投入。用户在原始数据的生成阶段作出了经济投入,如设备购置费用、网络接入费用,基于此种经济投入,用户对其生成的原始数据享有数据所有权。数据处理者可以依据合同约定或法律规定取得用户数据的使用权,但应支付合理费用。
(三)数字劳动理论
1.数据来源者基于数字劳动对其生成的数据享有所有权
在探讨个人是否拥有个人数据产权的议题上,我国学界有观点认为,数据产权应当归属于对数据进行处理的企业,而不是作为数据来源者的个人。这一立场主要受到了洛克劳动赋权理论的影响,该理论认为个人通过其劳动——无论是身体劳动还是智力劳动——所创造的一切,均应归劳动者所有。根据这一逻辑,由于企业在用户数据的生成和处理中投入了劳动和资本,因此企业理应享有数据产权。这种观点在我国司法实践中也有所体现。例如,在“淘宝(中国)软件诉安徽美景案”中,法院认为,淘宝公司对其数据产品具有法定的竞争性财产权益,而个别用户的数据本身缺乏直接的经济价值。除非有法律规定或特别的合同约定,否则网络用户对于其提供给网络运营者的数据不享有独立的财产权。同样,在“腾讯与浙江搜道网络技术有限公司的不正当竞争纠纷案”中,法院认为网络平台通过长期经营积累的用户数据,应为平台方所拥有。
然而,上述观点在一定程度上忽视了用户在数据产生过程中的贡献。传统的劳动理论强调,只有有意识、有目的的行为才能被视为劳动。反观用户的网络行为,如浏览、点赞等,往往是在休闲娱乐中无意识进行的,从而被视为非生产性的。在这种判断下,用户对数据的贡献不被视为劳动,数据自然也就不属于用户的劳动成果。平台等数据企业所进行的数据处理,才能算得上劳动。不过,将用户的这些行为简单归类为非生产性劳动,对用户而言并不公平。英国学者克里斯蒂安·福克斯的研究表明,数字经济下劳动与娱乐的界限越来越模糊,劳动往往具有娱乐性质,而娱乐活动也逐渐带上了劳动的色彩。在这样的背景下,将用户在使用智能设备或网络服务中生成数据的行为,一概视为娱乐或非生产性劳动,实际上是在为数字巨头开脱,忽视了资本从这种劳动形式中获利的事实。这就如同家务劳动,它没有工资,主要是在业余时间进行的,本应是一种有价值劳动,却不公平地被称为非生产性劳动。
事实上,在数字时代的发展背景下,传统劳动理论中关于有意识与无意识劳动的区分已无法适应新兴的劳动形式。以2021年上海智己汽车科技有限公司推出的“CSOP用户数据权益计划”为例,该计划创新性地将4.9%的股权分配给汽车用户,作为对其数据贡献的奖励,从而为车主提供了通过其日常驾驶产生的数据获得收益的机会。通过“里程式开采”和“养成式开采”等模式,车主在日常使用中产生的数据被转化为有价值的“原石”,这些“原石”不仅可以兑换硬件升级、软件服务等,甚至可换取公司股权。我们通过实地调研发现,智己汽车的“CSOP用户数据权益计划”已经催生了一种新型的职业——数据跑手,有的车主专门通过驾驶智己汽车来生成数据,以此获取数据收益。
上海智己汽车科技有限公司推行的“CSOP用户数据权益计划”不仅是对传统劳动理论基本假设的一次挑战,更是在法理上对劳动与产权关系的一次重要探讨。该计划淡化了有意识劳动与无意识劳动之间的界限,并展示了如何通过赋予数据产权将无意识劳动转化为有意识的价值创造过程。“CSOP用户数据权益计划”通过明确将数据产权归属于车主,为车主赋予了对自身行车数据的控制权和收益权。这种创新的权益配置不仅增强了车主对自身行车行为的经济价值认识,而且重新定义了这种日常行为是具有经济价值的劳动行为。此举不仅提升了车主的经济利益认知,也促使其行车行为从简单的日常活动转变为一种潜在的经济活动。通过直接的价值回馈机制,车主能够直观感受到自己的“劳动”所带来的经济回报,这种机制显著提高了车主主动生成数据的积极性,视之为获取经济报酬的一种手段。同时,正是因为这种制度的激励,可以为作为数据处理者的车企催生一批“不拿工资的试驾员”,花钱买车的车主们在制度创新的激励之下,“跑起来”为车企贡献数据。由此可见,对作为来源者的车主进行数据赋权,不仅公平而且最大限度地提高了效益。
可见,随着生产要素从土地向数据转变,劳动形态亦随之发展,要求传统劳动理论进行相应的更新。大数据、云计算、区块链、物联网、人工智能等新兴技术极大地改变了劳动方式,促进了劳动形式从实体空间向数字虚拟空间的转移。英国学者克里斯蒂安·福克斯将这种现象定义为“数字劳动”,强调网络用户在互联网产品使用过程中产生的数据属于一种新型劳动形式,用户对此类数据应享有产权。在社交、电商、共享经济等数字平台的推动下,形成了一种新型的“大型工厂”,其生产线由广泛的用户互动和交易构成,这些活动无形中生产出的数据本质上也是劳动的一种形式。
基于数字劳动理论,在用户生成的数据客观上展现出经济价值时,这一数据生成过程应被明确界定为一种价值创造行为。美国学者埃里克·波斯纳和格伦·韦尔亦在其研究中提出,用户数据应被视作劳动的产出,强调用户对其产生的数据享有产权。这表明,虽然数据的加工与分析依赖企业的投入,但用户作为数据的原始生成者,理应对所生成的数据享有所有权。不过,在现实生活中,尽管用户为平台资本生产了具有实际使用价值的数据,但常常无法获得任何产权或收益。反之,是平台以牺牲用户利益为代价获得了利益,平台通过控制用户数据,将之汇集并作为商品出售,进而实现盈利。用户在线活动所创造的价值,虽然最终转化为资本的增值和货币资本,但用户实际上得不到任何收益。而且,实证研究已经表明,免费的网络服务算不上用户数据的合理对价。
进一步而言,一些大型互联网平台通过其对数据的控制,形成了一种类似公权力的私有权力体系,能够像行政机关征用一样,强制获取用户数据作为其主要的收入来源。正如有学者所言:“不平等的数据关系导致了不公正的积累,进而隐藏剥削的风险,数据要素具体利用场景中,数字平台通过提供服务无偿或者廉价取得了用户数据,用户无法了解数据的具体使用情况,也无法估量和分享其中的经济利益,单方面的无知状态削弱经由协商对话产生更加合理安排的可能。未明确规定的数据收益权将削弱单一传统权利范式的激励效果,影响一次分配和共同富裕。”这使得用户无偿提供的劳动创造的剩余价值和利润被企业所垄断,揭示了企业与用户之间的价值剥夺关系,同时反映了平台经济背景下不均等的权力结构,这导致了数字劳动者在数字劳动过程中遭受主体性异化。为了防止数字劳动者的劳动贡献在数据价值链中被忽视和剥削,有必要确保用户及其他数字劳动者能够对其产生的数据享有财产性权益(数据所有权)。赋予用户对其数据的产权不仅是对劳动价值的认可,也是对平台经济中权力结构的一种必要调整,以促进更公平的数据经济生态。
综上,数字劳动理论为我们提供了理解和分析数字时代劳动形态变化及其社会影响的新视角。这一理论不仅强调了用户在数字经济中的关键角色,同时也揭示了平台经济中存在的利益剥夺等不平等问题。未来的探讨需要更多关注如何平衡企业与用户间的权利关系,确保用户在数字经济中能够公平地获得其应有的权益和收益。为数字劳动者(用户)赋予个人数据所有权,不仅顺应了新型数字劳动形式的发展,也是实现数字红利公平分配的关键步骤。因此,承认并保护劳动者在数字环境中通过新型劳动形态获得的数据所有权,是适应数字时代劳动理论革新的必要方向。
2.数据处理者基于劳动投入对用户数据享有用益权
就收集个人数据的企业而言,其同样付出了大量的劳动和资金投入,赋予其相对稳定的财产权有利于数据资源的优化配置与激励机制的形成。但若赋予处理者以数据所有权,不仅违背了数据是由数据来源者引发产生这一逻辑起点,也违背了洛克财产权理论中“充足留存”(the sufficiency condition)和“禁止浪费”(the prohibition of waste)两项限制要件。充足留存要件强调,尽管个人有权通过劳动获得财产权,但这一权利并非无界限,它不得侵犯他人基本的生存权利及获取资源的平等机会。如果个人在积累财产的过程中导致资源的枯竭,以至于其他个体无法获得满足其基本生活需求的资源,那么超出合理限度的财产权便失去了其正当性。一旦财产积累超出了个人合理需求的范围,侵犯了他人的利益,那么超出部分的财产权便不再受到保护。禁止浪费要件要求个人在拥有财产时,必须承担起对这些财产的管理责任,确保资源得到合理且高效的利用,避免任何形式的荒废或浪费。如果在财产的使用过程中发生了浪费或超出了合理使用的范围,那么他们将无权继续享有这些权利。换言之,当个人的财产使用损害了他人的利益,或超出了满足个人生活需求的合理界限时,他们便失去了对这些财产的所有权。
而将数据所有权配置给企业将违背上述两个原则,因为它会导致数据资源的垄断和浪费,损害中小企业的发展机会和数据资源整体的利用效率。首先,基于数字化技术的特性,企业对于数据控制极易造成数据垄断,在数据被少数企业垄断的情况下,企业为保持竞争优势倾向于限制其他小型企业或初创企业获取数据,挤压他们的发展空间和竞争力。在此情形,若赋予企业以数据所有权,则会导致中小企业无法获取必要的数据资源以满足其基本需求或参与市场竞争,违背了充足留存要件。其次,企业基于垄断优势,为了维护自身的财产权利,会过度限制数据的共享和流通,阻碍其他企业或研究机构对这些数据的有效利用,从而造成社会资源的浪费,违背了禁止浪费要件。可见,将用户数据的所有权配置给企业,将超出财产权的必要用途和限度,不应受到保护,相反应当予以限制。
为此,可以借鉴“自物权—他物权”和“著作权—邻接权”的权利分割模式,在数据权利体系的设计上,根据不同主体对数据形成的贡献来源和程度的不同,设定数据来源者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构,以实现用户与企业之间数据财产权益的均衡配置。不过,数据处理者仅仅基于劳动和投资便让数据处理者享有用益权尚不具有充分的正当性,因为用益权源于在先的所有权,所以作为源权利人,数据所有权人的授权必不可少,无论所有权人是自然人、企业还是国家,合法处理原则上须具备前提条件,即数据所有权人的知情同意,这便是取得数据用益权的另一正当性基础。
需要说明的是,“数据所有权+数据用益权”的权利分割模式不是非此即彼的单一赋权思维,而是作为来源者的个人和作为处理者的企业共享了数据的权利。这里的共享是指个人和企业对数据权利进行了分割,此种权利分割既符合逻辑又符合事实。在逻辑层面,谁引发了数据产生,谁就拥有数据的所有权;谁对数据的采集、存储、处理做出贡献,谁就拥有数据的用益权。在事实层面,数据形成过程中,作为来源者的个人和作为处理者的企业均有贡献,但都不是全部,我们应尊重事实以他们的贡献程度为基础,分别赋予所有权和用益权。
04 数据来源者权的具体构造
在证成对数据来源者赋权的正当性基础之后,需要在此基础上对数据来源者权进行规范构造。简言之,数据来源者享有什么权利及其权利的边界在哪里?《数据二十条》第7条规定要“充分保护数据来源者合法权益”,同时第3条开篇就规定,“根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利”。这里引发的问题是,如何根据数据的来源和数据生成特征的不同来分配各参与方在数据上的合法权利?特别是,“充分保护数据来源者合法权益”,这里的“来源者的合法权益”是什么内容?笔者认为,数据来源者基于数据生成的贡献而享有数据所有权,权利内容具体包括访问权、使用权、收益权。
(一)数据访问权
数据访问权,即用户访问、查询相关数据内容的权利。实践中,虽然用户参与了数据生成,但这些数据往往被企业实际控制,用户难以在自己的设备端直接访问数据。以智能汽车为例,用户在使用过程中产生的数据通常存储在车辆的内部系统中,进而被传输到制造商的远程服务器。用户想要访问这些数据,需要汽车制造商提供特定软件或接口才能访问。例如,车主在事故发生后,需要依赖汽车制造商提供的数据来进行事故原因分析和责任认定。然而,由于数据的敏感性和商业机密的保护,制造商可能会有所保留,不愿意完全公开数据,这可能导致车主在事故调查和法律诉讼中处于不利地位。
针对此种情况,数据持有者(通常是联网设备的制造商)应当允许用户免费访问其生成的数据。王利明教授指出,数据来源者对数据的形成作出了贡献,赋予用户等数据来源者对数据的公平访问权,可以被视作对其在数据形成过程中所作贡献的一种补偿。如果用户无法从联网产品或相关服务中直接访问数据,数据持有者应在不无故拖延的情况下,以全面、结构化、常用和机器可读的格式,向用户提供随时可用的数据,以及解释和使用这些数据所需的相关元数据,其质量应与数据持有者所提供的相同,且应方便、安全、免费,并在相关和技术可行的情况下,持续和实时提供。在技术可行的情况下,应通过电子手段提出简单的请求。如果用户要访问的数据涉及到商业秘密,数据持有者应与用户商定必要的相称技术和组织措施,以维护共享数据的机密性。在用户未能执行商定的保密措施或破坏商业秘密的保密性的情况下,数据持有者可暂停共享被确定为商业秘密的数据。
数据来源者不仅自身享有数据访问权,也有权授权第三方对数据进行访问,在法律功能上相当于数据携带权。欧盟《数据法》第5条第1款规定,应用户一方的要求,数据持有者应在不无故拖延的情况下,向第三方提供现成的数据以及解释和使用这些数据所需的相关元数据,这些数据的质量应与数据持有者所提供的相同,应方便、安全、免费提供给用户,格式应全面、结构化、通用和机器可读,并在相关和技术可行的情况下连续和实时提供。需要说明的是,数据持有者在向第三方提供用户数据时,可以收取合理费用,但应当遵循公平、合理和非歧视的原则。在获取数据后,第三方只能将数据用于约定的目的,不得将数据用于其他目的或与其他组织分享数据,不能超出用户授权的范围使用数据。
就数据访问权的客体范围而言,用户的数据访问权仅限于由他们使用产品或相关服务生成的数据(data generated by use),而不是与用户相关的所有数据。所谓“生成的”数据包括那些“代表用户行为或与联网产品相关事件的数据”,这些数据涵盖了至少由用户有意记录的“原始”数据,以及作为用户行为副产品而生成的数据。用户对其生成的原始数据享有访问权并无异议,但访问权能否延伸至衍生数据存在争议。欧盟《数据法》的立法者在序言中指出:“从原始数据中推断或衍生出的数据,即对数据赋值或洞察力进行额外投资的结果,特别是通过专有的复杂算法,包括作为专有软件一部分的算法,不应被视为属于本条例的范围,因此,除非用户与数据持有者之间另有约定,否则数据持有者没有义务将衍生数据提供给用户或数据接收者。”我国学者也认为,经由企业深度加工形成的衍生数据与来源者生成的原始数据无直接对应关系,故不在数据来源者权利范围之内,企业对其享有独立的排他性财产权。
德国学界的观点与欧盟《数据法》的立场不同。德国马普创新与竞争研究所的研究指出,数据访问权应当包括衍生数据,因为衍生数据对于实现数据访问权的目的——开放二级市场(如维修、售后服务)——至关重要。在工业机械的预测性维护领域,制造商能够利用累积的设备性能数据来生成预测机械组件(如齿轮、轴承、电机等)寿命的关键衍生数据;同样,通过分析设备的能耗数据,他们能够发现异常的能耗点。面对这样的情况,当工业机械用户希望委托第三方进行预测性维护时,若第三方服务提供商无法访问这些衍生数据,他们可能就无法进行有效的问题诊断或提出最优的服务方案。因此,衍生数据对于开放二级市场,促进竞争和创新至关重要。鉴于衍生数据的重要价值,笔者主张,用户出于预测性维护等合理目的,有权在目的范围内访问衍生数据,但应当支付合理费用。
综上,在法律上赋予数据来源者以数据访问权,确保用户可以访问并控制自己的数据,不仅有助于保障用户能够从自己的数据中获益,也有助于刺激二级市场,为新兴的服务模式和业务创新提供动力。
(二)数据使用权
数据使用权,即依据法律规定和合同约定,用户可以根据自身需要在各个生产经营环节自主加工使用其数据和对数据进行合理利用的权利。欧盟《数据法》第2条要求产品的设计和制造,以及相关服务的提供应该确保用户可以便捷地、安全地获取产品使用过程中产生的数据,并且可以通过适当的方式直接获得相应数据。之所以承认数据来源者对数据的使用权,主要是考虑到数据来源者对数据的形成有贡献,对数据的合理利用权在某种意义上可以被看作数据来源者贡献的一种对价。
数据来源者的数据使用权主要涉及两个问题:一是数据来源者从数据持有者那里获取数据后,数据来源者对数据的使用是否受到限制;二是数据持有者对用户数据的使用是否受到数据来源者的限制。就第一个问题,用户在获取数据后,其后续使用应当受到一定的限制。欧盟《数据法》第4条第10款规定,用户不得将获得的数据用于开发与联网产品相竞争的产品,也不得出于此目的与第三方共享数据,并且不得利用这些数据深入了解数据持有者的经济状况、资产和生产方法。不过,用户可以将数据用于非竞争领域,如将获取的数据用于算法研发。
就第二个问题,数据持有者对用户数据的使用事先须得到用户的授权。根据欧盟《数据法》第4条第13款和第14款之规定,数据持有者只能在与用户签订合同的基础上使用用户生成的非个人数据。除履行与用户的合同外,数据持有者不得出于商业或非商业目的向第三方提供用户的非个人数据。依此规定,数据持有者在没有与用户签订合同的情况下,无权使用用户生成的非个人数据。例如,车主A购买了一辆智能汽车,并与智能汽车制造公司B签订了一份包含数据使用条款的合同。合同约定,B可以使用A生成的用户数据来优化车辆性能并提供维护建议。如果B想要将收集到的用户数据出售给第三方数据分析公司,用于交通流量研究,则根据欧盟《数据法》,除非B在与A的合同中已经获得了类似用途的明确授权,否则它不得将这些数据提供给第三方。这一结论意味着,立法者实际上赋予用户以独占的数据使用权。
(三)数据收益权
数据收益权,即用户通过许可使用等方式获取收益的权利。没有用户的贡献,就无法产生海量的用户数据,企业也就没有原材料来制作数据集合。用户在数据生成阶段不仅付出了数字劳动,而且通常使用的是自己购买的电子设备、网络通信服务来生成数据,基于这些劳动和资金投入,用户对其生成的数据应当享有收益权。基于收益权,用户有权参与利益分配,如收取许可费或者换取网络服务。企业在尊重用户权利的前提下,通过“获取授权+支付对价”的模式,获得了稳定充分的一项独立的数据集合专有权。
承认并确认数据来源者的数据收益权,也符合《数据二十条》的本旨。《数据二十条》明确提出要“建立健全个人信息数据确权授权机制”“推动数据处理者按照个人授权范围依法依规采集、持有、托管和使用数据”,并“探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制”。据此,个人享有是否授权企业处理其个人数据的权利,数据处理者“持有”“托管”“使用”数据的财产权能来源于“个人授权”,而个人得以授权的前提必然是对个人数据享有财产权。
其次,《数据二十条》第12条指出,要“探索个人、企业、公共数据分享价值收益的方式,建立健全更加合理的市场评价机制,促进劳动者贡献和劳动报酬相匹配”。那么,数据来源者势必因为其对数据价值的贡献而享有财产利益的收益。而这也是非公共数据按市场化方式“共同使用,共享收益”新模式得以被构建的目的所在。
实践中,我国已经有地方和企业开始探索用户数据红利的分享机制。例如,2023年7月,北京市印发《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》,对《数据二十条》关于探索个人数据分享价值收益方式进一步探索,创新性地明确“探索个人以按次、按年等方式依法依规获得个人数据合法使用中产生的收益”。2023年4月,中国最早成立的大数据交易所贵阳大数据交易所宣布,它监督并协助完成了中国首例个人数据的场内交易。在征得个人用户同意后,贵州当地科技公司“好活”收集他们的简历并将信息处理成数据产品,通过加密计算等技术确保可用性和隐私。之后,该公司将数据产品上架贵阳大数据交易所,用人单位可以在交易所购买数据,而个人用户可以通过平台获得其个人简历数据产品交易潜在的利润分成。又如,上海智己汽车科技有限公司2021年发布了“CSOP用户数据权益计划”,承诺将4.9%的股权配置给汽车用户,用以回馈用户数据价值。此外,汽车用户数据还可以用来兑换软硬件升级、智享服务、限定精品、数字藏品以及限定体验活动等。随着数据改革措施的进一步深入,个人数据实现机制的社会实践将会更加丰富多彩。
05 结语
原始数据的生产、生成奠定了数据资源集成的基础,为数据加工使用和开发利用提供了数据资源保障。原始数据的主体是最重要的数据来源者。正是基于原始数据和原始数据来源者在数据产权制度中的基础性地位,数据产权法律构造应当充分保障数据来源者的合法权益,《数据二十条》第7条规定的“充分保护数据来源者合法权益,推动基于知情同意或存在法定事由的数据流通使用模式,保障数据来源者享有获取或复制转移由其促成产生数据的权益”就是体现。
在界定数据来源者时,应当将其与信息来源者相区分。信息来源者是数据承载信息所描述的对象,但信息来源者并未直接参与数据产生的过程,也未向数据持有者提供数据。由于信息来源者并未直接创造或贡献数据,故其对于承载相关信息的数据并没有财产性利益。借鉴欧盟《数据法》经验,应当将我国的数据来源者界定为数据初始生成者,即在数据生成过程中通过投入劳动和成本、引发数据从无到有的主体,包括自然人、法人、非法人组织、国家。基于劳动财产论和数据生产理论,数据来源者对其生成的数据享有数据产权。在此基础上,自然人可以对投入劳动和成本的数据(而不局限于个人数据)取得数据产权;企业特别是互联网平台企业可以对平台数据取得数据产权;国家可以就公共数据取得数据产权。
未来,随着数据产权制度在数据来源者和数据处理者之间得到清晰合理准确的界定,数据要素的价值将得到极大的释放,助推我国数字经济的高质量发展,实现中国式现代化的腾飞。
(本文仅代表作者观点,不代表知产财经立场)
查看更多知识产权精彩内容,请浏览知产财经官网:www.ipeconomy.cn