作者:胡开忠 中南财经政法大学知识产权研究中心教授
随着生成式人工智能等颠覆性AI技术的突飞猛进,人类社会的生产、生活方式乃至社会治理模式都将随之迎来新的变革。在这一时代背景下,如何认识人工智能产业发展带来的各种法律问题,也越来越具有现实意义。基于此,7月13日,由中国人民大学知识产权学院主办、知产财经协办的“人工智能相关法律适用问题”研讨会在北京举办,会议邀请了行业多领域代表,共同探讨和研究实务中遇到的涉人工智能法律问题及解决之道,以期为人工智能相关环节的法律适用问题探究答案。会上,中南财经政法大学知识产权研究中心教授胡开忠围绕“人工智能生成物法律保护的前提和路径思考”话题进行主题演讲,知产财经对其主讲内容进行了整理,以飨读者。
感谢主办方的邀请,很高兴能够参加本次会议。刚才听到很多专家讲了前沿性的问题,我也获益匪浅。在此我想讨论一下人工智能生成物法律保护的前提和路径思考。
近年来,涉人工智能的知产问题引起行业高度关注,百家争鸣。我非常欣赏和赞成李明德老师提出的一个观点,对于目前法律在新技术环境下遇到的一些问题,很多都可以用现行法律来解决,我们在处理这些问题时,要遵从法律的基本原理来讨论。
一、人工智能生成物涉及的利益主体
在讨论这个问题之前,首先我们要弄清楚人工智能生成物这个问题涉及到的一些利益主体。人工智能生成物实际上在两个阶段涉及到不同人的利益关系。一是在数据训练阶段,涉及到著作权人与人工智能技术开发者之间的利益,也就是说人工智能技术开发者这些产业主体要进行数据训练,必然要利用到他人的作品。二是人工智能生成物生成和输出阶段,涉及到两个主体的利益,一个是开发模型的人工智能技术开发者,另一个是使用人工智能模型的人工智能平台用户,其通过使用人工智能模型生成一些作品。用户和平台之间,平台和技术开发者之间,他们的关系怎么来协调。任何一个法律问题的背后实际上都是利益在影响法律的制定。
二、使用有版权作品训练生成式AI并生成新作品的行为的合法性判断
(一)是否构成侵权行为
关于这个问题,有的学者提出,使用作品训练的行为是合理使用,也有些人认为不构成合理使用。这些观点我认为都是伪命题,人工智能的开发者为什么要使用数据训练,最终是要生成人工智能生成物的,生成类似作品、产品的东西。在讨论数据训练是不是合法时,应当把数据训练阶段和人工智能生成物生成、输出阶段结合起来,而不是说单独去讨论数据训练的过程。数据训练只是一个过程,不能说这个过程是合理使用还是非合理使用。在讨论此类问题时,如果把行为和结果结合起来,传统侵权法的原理还是可以适用的。比如判断数据训练行为是否构成侵权时,要看主观上是否有过错,客观上是否实施了侵权行为,是否造成了损害,损害与行为之间是否有因果关系,是否符合免责的条件,比如合理使用或者法定许可,或者进行数据训练使用的作品不受版权保护了,还讨论是否侵权是没有意义的。
(二)是否构成合理使用
在讨论数据训练是不是合理使用时,应当根据《伯尔尼公约》规定的三步检验法来判断,或者有时候我们可以参考美国版权法规定的合理使用的四要素判断法来分析。这两个本质上是一样的,只不过美国的规定更具体一点。如果说用四要素来判断,在数据训练时应考察使用作品的目的和性质。
一般来讲,合理使用主要是限于一些非营利性的使用,或者像教学、公益性的使用,但是数据训练在很多场合下是营利性的使用。但也不绝对,比如进行数据训练,训练之后我学到一个方法帮我来辨别这个作品是诗歌还是散文,帮助我更好地对作品进行分类,不生成新的作品当然就不构成侵权。另外像广互审理的案子,把奥特曼拿去训练之后,生成类似奥特曼的作品。但是如果把奥特曼和孙悟空这样的作品拿去训练,最后小朋友拿了一个画,请AI辨认画是孙悟空还是奥特曼,AI辨别之后说这是奥特曼。这是对作品功能性的使用,没有生成新作品,与原作品不构成市场竞争,也没有损害,当然这是符合合理使用的。
受版权保护作品的性质。刚才有专家提到,在训练时,有些人在获得作品时有一些受版权保护,还有一些是从其他的地方利用爬虫或者其他非法手段来获取的。如果是非法手段获取的,当然谈不到合理使用的问题。使用版权保护作品的数量和质量,以及使用对版权作品潜在市场价值的影响,在数据训练时应当注意到,现在的数据训练不是我们版权法明确列举的合理使用的情形,此种使用跟传统环境下的引用或者为了教学、研究来使用这个作品是不一样的。目前在数据训练时,几乎会把所有的作品都拿去进行数据训练,而且作品有用的地方都会被使用,对于原作品使用的数量,它已经超出了原有的合理使用数量的限度,数据训练之后,AI把所提供的作品通过拼凑、组合、改编,最后形成了一个东西,几乎向全世界所有使用人工智能模型的人都提供,此种使用数据的规模和数量已经远远超出了传统的合理使用所规定的数量和质量的要求,它对于版权人的利益绝对是有影响的。在该情况下,将其认定为合理使用是比较困难的,应当对版权人进行一定的补偿。刚才有产业界的同志提出来,要征得著作权人的同意比较难,这种情况下我们是不是可以考虑通过集体管理来授权,或者设定法定许可制度,要求人工智能企业在数据训练时给版权人以适当的补偿,这样既可以保证作品的利用,也可以给著作权人一定的补偿,这是应当考虑的立法问题。
三、人工智能生成物法律保护的路径
关于人工智能生成物法律保护的途径。前面有位专家也谈了,有些人主张对AIGC进行版权保护,他们认为人工智能生成物有作品的外观,有独创性,还有智力投入,政策上应当支持。当然也有一些持否定观点的,认为AIGC没有独创性,输入提示词或者输入参数的行为都不是创作,在美国AI的开发者不需要著作权法提供保护。
对于这个问题,因时间关系不再展开,我还是支持后一种,反对对纯粹的人工智能生成物授予版权。有几个理由,第一,从作者的角度来讲,著作权法保护的作者是人而不是机器;第二,创作是一种直接产生作品的行为,输入提示词、参数都不是创作;第三,著作权法是保护作品的表达,而不保护作品的内容,算法、参数之类属于内容;第四,著作权法所讲的独创性,既有数量的要求,也有质的要求,要求有一定的创作风格。
AI纯粹生成的内容,它的创造性比人要差得多。如果对大量AI的拼凑、组合、改编现有作品生成的内容都给予版权保护,以后会造成不良影响,打击人的创造性。AI生成一个作品是很容易的,将来会生成一大堆的像联合商标一样的内容,比如用人工智能技术生出一个蜻蜓,它把现有的关于蜻蜓的类似的绘画都生成之后,以后自然人想画一个蜻蜓画不了了,因为AI把各式各样的蜻蜓都画出来了,人画的内容与AI生成内容构成了实质性近似,将来都侵权,这对画家的影响是很可怕的,所以一定不能降低独创性的保护标准。
对于AI纯粹生成的内容完全不保护,这个观念也很绝对,也不太公平,毕竟人工智能企业进行数据训练模型、算法的过程中付出了劳动,对于人付出的劳动、产品的投入、投资也应当给予一定的回报,数据训练模型、算法可以作为商业秘密给予保护,此外在其基础上开发的软件,可以用著作权或者专利保护,AI企业可以通过技术保护措施对作品进行一定的保护,比如区块链技术,还有一些企业采取营利模式,比如向注册用户收费、广告宣传等等,这在一定程度上也保护了AI企业的利益。
对于平台和用户来讲,也有一些人力、物力、算力的投入,也希望给予保护,对于这样的劳动成果,可以考虑给予一定的经济利益。这个经济利益怎么保护,比如利用合同法,通过约定的方式给予保护,或者利用反不正当竞争法给予一定程度的保护。这些保护都是弱保护,甚至在未来,我们可以考虑在现有的知识产权制度之外,建立一种新的无形财产权保护模式,比如像数据、虚拟财产、形象权、商誉等用传统的知识产权法很难保护,但是如果构建一种新的无形财产权,或许能够解决这些问题。未来要考虑的是在法律上要革新,而不是非要把AIGC纳入到版权法里,在这个死胡同里继续走是不合适的。
以上是我的观点,谢谢大家。
(本文仅代表作者观点,不代表知产财经立场)