作者:蔡鹏 中伦律师事务所合伙人
一、引论:AIGC对“作者”法律定义的挑战
1.1 AIGC的“黑箱”特性对传统版权理论的冲击
生成式人工智能(Generative AI)及人工智能生成内容(AI-Generated Content, AIGC)相关技术,特别是其“黑箱性”(black box)与“不可预测性”(unpredictability),正对传统版权法理论构成根本性挑战。传统版权理论假定:创作者——无论是作家、画家还是作曲家——对其创作工具(如笔、画刷或乐器)拥有近乎完全的物理控制,从而将其内心的“思想”精确地“表达”为最终的作品。
然而,AIGC打破了这一“思想—工具—表达”的三角关系。当用户输入一个提示词(prompt)时,即便是高度详细的指令,AI模型如何选择内容、如何组织像素、如何呈现风格,对人类用户而言在很大程度上是不可预见和难以精确控制的。这种“控制”的缺失,使得“创作”行为本身的法律判定变得明显复杂化,从而突出了传统版权理论在应对AIGC时的制度困境。
1.2 人类在何种程度上贡献了AIGC作品的独创性
AI本身能否成为作者?对于这一问题很容易形成共识。版权法保护的是人类的作品,并非机器。法律分析的焦点已经转向一个更具争议性且亟待解决的前沿问题:如果AI被定位为“作者的画笔或照相机”,即一种高级的创作工具,那么使用该工具的“人”,需要做出何种程度、何种性质的贡献,才能被法律认定为该AIGC作品的“作者”?这一问题的核心,在于法律审查的重心必须从评估“AI的自动化程度”转向“人类所贡献的独特产出”。
1.3 保护有质量的“智力体现”是核心
在美国版权局(United States Copyright Office,USCO)拒绝Théatre D'opéra Spatial一案的登记申请中,艺术家Jason Allen声称其输入了“至少624个提示词”并进行了“大量修改”,但这一巨大的“物理贡献量”并未使其获得作者身份。此案生动地揭示了AIGC的版权保护边界不应锚定在人类贡献的“最终篇幅”或“物理数量”(如修改次数、提示词字数)上,更不应锚定在人类对AI“黑箱”的“机械控制”上。
相反,版权保护的核心锚点应当是“人类在作品中的智力体现并予以表达”。这包括创作者独特的构思与表达、作者与表达的对应性,以及在生成过程中体现其主观选择的迭代筛选与表达修改。
本文旨在通过中美比较法的路径,初步系统地论证为何这种“智力体现”的质量(而非其数量或控制)是界定AIGC版权唯一合法且有效的标准。
二、比较法的基础:中美对“人类作者”原则的坚守与演绎
在AIGC版权问题的全球讨论中,中美两国作为关键的司法管辖区,在法律的基石——“作者”必须是“人”——这一原则上,达成了高度共识。然而,两国达成共识的路径与法理演绎却不尽相同,而正是这种演绎的差异,为后续认定标准的分歧埋下了伏笔。
2.1 美国法下的“基石”:Thaler v. Perlmutter 案的系统性论证
美国法下对“人类作者”原则的坚守,在Thaler v. Perlmutter一案中得到了系统、权威的阐述。该案中,申请人斯蒂芬·泰勒(Stephen Thaler)博士将其AI系统“Creativity Machine”列为一幅名为《通往天堂的新近入口》(A Recent Entrance to Paradise)的视觉艺术作品的唯一作者,并主张AI应被承认为作者。
USCO拒绝了该申请,理由是作品缺乏“人类作者”。经过逐级上诉,美国哥伦比亚特区联邦巡回上诉法院在2025年3月作出最终裁决,明确指出“人类作者身份是美国版权法的基石性要求”(Human authorship is a bedrock requirement of copyright)。
法院指出,《版权法》中的诸多核心制度设计,均预设了“作者”必须是“人类”:
其一,财产权主体:版权是一种财产权,其主体必须是能够拥有财产的法律实体,而机器不具备此资格;
其二,保护期限:版权保护期通常以“作者的有生之年加70年”计算,而机器没有“寿命”;
其三,继承权:版权涉及配偶、子女等人类家庭关系,机器没有继承人;
其四,意图(intention):合作作品要求作者之间存在“共同创作意图”,而机器没有意识,无法形成法律意义上的“意图”。
2.2 中国法下的共识:AI作为“画笔”或“照相机”的工具定位
与美国通过标志性判例进行体系化法理论证不同,中国司法实践通过个案中的“工具论”比喻,生动阐述了中国《著作权法》中“作者必须是人”的基本原则。
在北京互联网法院审理的“春风送来了温柔”案(中国首例明确支持AI生成图片构成作品的判决)中,法院明确将AI模型Stable Diffusion比作“作者的画笔或照相机”。法院认为,AI是作者用于创作的辅助工具,其法律地位与传统的创作工具无异。
在其他相关判决中,我国法院维护了《著作权法》的主体必须是自然人的法律原则。这种将AI作为“工具”的定位,将法律审查的焦点从AI本身,转移到了使用AI的“人”身上。
2.3 从原则到实践:共识所遗留的核心问题
当中美两国都确认AI只是“工具”,而“人”才是潜在的作者时,一个远比“AI是否是作者”更棘手、更复杂的法律问题浮出水面:使用照相机作为工具的人,按下快门即可在绝大多数情况下被认定为作者;但使用AIGC作为工具的人,输入一个简单的提示词(如苏州“蝴蝶椅子案”)时,却可能不是作者。
人类与AI合作产生作品,到底需要做什么才能成为法律意义上的作者?核心问题就在传统的版权“思想与表达二分法”,并据此重新划定人类贡献的准入门槛。
三、共同的边界:“思想与表达二分法”下的提示词(prompts)定性
“思想与表达二分法”是版权法的基本原则。法律只保护思想的独创性表达(如小说的情节设定、美术作品的构图色彩),而不保护抽象的构思、主题、方法等“思想”本身。
在AIGC场景中,人类用户最直接的贡献——提示词(prompts),在法律上应如何定性?在这一点上,中美两国的司法和行政实践再次达成了共识:简单、常规的提示词本身属于“思想”范畴,不受版权保护。
3.1 中国司法实践:上海“提示词”案
中国首例对AI提示词本身是否构成作品进行裁判的案件——2025年上海市黄浦区人民法院就某案件作出的判决,为提示词的法律定性提供了清晰的参照。
该案中,原告主张其为AI绘画平台Midjourney撰写的一系列“精心设计”的提示词,构成了受保护的文字作品。法院经审理后,驳回了原告的全部诉讼请求,其核心理由有二:
其一,缺乏独创性。法院认为,尽管原告的提示词看似复杂,但其内容“各元素间仅为简单罗列,缺乏语法逻辑关联”“关键词组无序组合”。更重要的是,这些提示词“缺乏作者的个性化特征”,所选用的艺术风格、材质等均属“该领域常规表达”,未能体现作者独特的审美视角或艺术判断。
其二,属于思想范畴。法院进一步运用“思想与表达二分法”明确指出,涉案提示词“仅体现抽象的创作想法和指令集合”,其核心是“对画面元素、艺术风格、呈现形式等的罗列与描述”,这些内容更多属于“抽象的创作构思,属于思想范畴”。
本案判决为“思想”设定了一个明确的下限——即便是经过选择和堆砌的、描述性的“指令集合”,如果缺乏“个性化特征”和“作者特有的逻辑”(“表达”的结构),就仍然停留在“思想”层面,不受版权法保护。
3.2 美国行政实践:USCO的立场
USCO在其发布的《版权登记指南:包含AI生成材料的作品》(2023年)及《版权与人工智能报告》(2025年)中,采取了与上述上海法院实质相同的立场。
USCO明确指出,提示词(prompts)在功能上“更像是对委托艺术家的指示” (instructions to a commissioned artist),其本身是“不受保护的想法”(unprotectible ideas)。
USCO论述了提示词与“控制”标准的关系:即使用户提供了“高度详细的提示词”,用户也无法“控制AI系统如何处理这些元素”,以及如何将其“表达”出来。因此,提示词只是“想法”,而AI(机器)完成了最终的“表达”。在Théatre D'opéra Spatial案中,USCO审查委员会也重申,无论提示词多么复杂,其本质都是在“接受”AI系统对指令的“解释”,而非作者自身的表达。
3.3 比较法视野下的共识与张力
中美两国在AIGC版权审查的起点上达成了一致:简单的、常规的、作为“指令集合”的提示词,其本身(无论作为文字作品还是作为创作贡献的证据)均位于“思想”一侧,被排除在版权保护之外。
然而,这种共识的表面下隐藏着明显的分歧。上海“提示词”案否定的是“缺乏个性化”的提示词;USCO否定的则是“无法控制”的提示词。这留下了一个共同的、悬而未决的关键问题:如果一个提示词(或一系列提示词的迭代过程)既体现了“远超常规的独特构思与个性化表达”,又能通过参数设置和迭代修改(如“春风案”)对AI施加了足够的“智力投入”而非“机械控制”,它是否还能被轻易地归为“思想”?
在这一点上,中美的司法实践开始分道扬镳。
四、核心分歧:认定“独创性贡献”的中美标准比较研究
在如何认定“人”的贡献何时能跨越“思想”门槛、构成受保护的“独创性表达”这一核心问题上,中美两国则展现出了根本分歧。美国采取了“表达元素的实质性创作控制”标准,而中国则探索了“过程导向的智力投入”标准。
4.1 美国标准:“实质性创作控制”的严格审查
美国版权局和法院的审查核心是“人类创作控制”。USCO的指南明确要求,AIGC作品要获得保护,人类作者必须对最终作品的“表达元素”(如线条、色彩、构图)拥有“足够的”或“实质性的”控制。在当前技术下,USCO普遍认为,仅仅输入提示词“不能提供足够的控制”,因为用户无法“控制”AI如何“表达”该提示词(思想)。
这一严格标准在以下两个标志性案例中得到了充分体现。
其一是Zarya of the Dawn案。该案中,艺术家Kristina Kashtanova使用AI工具Midjourney为其漫画书生成插图。USCO在审查后,对这部漫画作品进行了“机械性拆分”处理:
拒绝保护图像:USCO撤销了对由Midjourney生成的单张图片的版权保护,理由是Kashtanova虽然输入了提示词,但她无法“预测”Midjourney的输出结果,因此她对这些图像缺乏足够的“创作性控制”。
批准保护汇编:USCO保留了对整部漫画书的版权登记,保护范围被严格限定为Kashtanova自己创作的文本内容,以及其对文本和图片的“选择、协调和编排”。
该案较完整地展现了美国“控制”标准的严格性。USCO将一部有机的漫画作品强行“分离”为了AI生成的图像(因人类无控制,故无版权)和人类编辑的汇编(因人类有控制,故有版权)。
其二是Théatre D'opéra Spatial案。如果说Zarya of the Dawn案是“严格拆分”的范例,那么Théatre D'opéra Spatial案则展现了“控制”标准的严格性。该案中,艺术家Jason Allen使用Midjourney生成的作品获得了科罗拉多州博览会的艺术奖项。在向USCO申诉时,Jason Allen强调了他对上述作品付出的“巨大的人类努力”,包括为了实现其“特定的艺术愿景”而进行的“至少624次提示词和迭代”。
然而,USCO审查委员会坚决拒绝了Jason Allen的登记申请,认定上述作品“缺乏人类作者身份”,核心理由是:当AI根据提示生成复杂作品时,其“传统创作要素”是由技术(AI)自主决定的,用户无法行使“最终的创造性控制”。
此案是美国“控制”标准基于传统版权理论的典型应用。即使Allen的“特定艺术愿景”(即“独特构思、设定、风格”)是清晰的,他也为此付出了“624次提示词和迭代”的巨大努力,但USCO仍然认为:当人类无法控制AI时,“智力体现”在法律上或者至少在版权无法获得保护。
上述案例体现了美国的“实质性创作控制”标准,特别是其对“表达的控制性”的刚性要求,这在AIGC场景下显得较为严苛。该标准所要求的“控制”在AIGC的场景下很难实现(尽管需要逐案评估)[1]。该标准最终奖励的是AI生成之后的修改和编辑(如Zarya of the Dawn案的“汇编”),而非AI生成前和生成中的“独特构思” 。
4.2 中国标准:“过程性智力投入”的灵活探索
与美国严格的“控制”标准形成鲜明对比,中国法院在司法实践中探索了一条更为灵活、务实的路径,即“过程导向的智力投入”标准。
该标准的审查重点不在于人类是否对最终输出的“每一个像素”拥有控制力,而在于“人类用户在AI生成过程中的具体行为”。法院会综合考察用户是否通过输入提示词、调整参数、选择模型、后期修改等一系列行为,对最终生成的内容施加了足够的“智力投入”和“个性化表达”。
这一标准在以下两个标志性案例中得到了充分体现。
其一是“春风送来了温柔”案。北京互联网法院在该案中支持了原告对AI生成图片的著作权主张,其判决理由的核心在于:法院不强求原告能够完全“控制”AI工具Stable Diffusion的输出,而是关注原告在生成图片过程中的行为,即原告“通过多次调整提示词、设置相关参数”,对画面元素、布局构图等“表达细节”进行“选择和安排”。法院认为,这一个性化的过程,清晰地体现了原告的“审美标准和个性判断”。因此,最终的图片(作为“表达”)体现了原告的“独创性智力投入”。本案中,法院认识到,人类的“独特构思”(审美标准、个性判断)可以通过“风格指令及修改”(调整提示词、设置参数)这一过程,被有效地注入到最终的AIGC作品中。
其二是上海“提示词”案与苏州“蝴蝶椅子”案。“智力投入”标准并非意味着无条件保护所有AIGC作品,上海“提示词”案和苏州“蝴蝶椅子案”作为反向判例,证明了该标准的有效性和对称性。
在苏州“蝴蝶椅子案”(全国首例否认AI文生图可版权性的案件)中,法院否定了涉案AI生成图片的独创性,理由是原告输入的提示词“属于相对简单的叠加……对画面元素、布局构图等描述缺少差异性”,且被告举证证明在原告之前已有类似概念的作品出现。同样,在上海“提示词”案中,法院也认定提示词“缺乏作者的个性化特征……属该领域常规表达”。
并置分析上述三地法院的判决,可以清晰地看到我国的司法裁判,已经为“智力投入”标准建立了一个相对宽松的“标尺”:当人类给予了独特、个性化、高投入的“智力体现”时,其作品(或贡献)能够跨越“思想”的门槛,构成受保护的“表达”;而当人类仅给予常规、简单、缺乏差异性的“智力体现”时,其贡献则停留在“思想”层面,不受保护。
笔者认为,中国司法实践中的“过程性智力投入”标准,在一定程度上比美国的“实质性创作控制”标准更具灵活性和前瞻性。它不强求人类对AI“黑箱”的物理控制,而是关注人类心智活动(审美、判断、选择)的质量。从法院的思路上看,它鼓励创作者进行“深度的人机协作”,利用AI作为“画笔”来实现其“独特构思”,而非因遵循严格的“控制”标准放弃对人机作品的保护。
但是,这种标准也存在过于宽松的问题。如何体现投入高?多次修改提示词是否就等同于投入高?如何对此进行理解和限缩,才能更符合《著作权法》“激励创作、促进科学与艺术的进步”的立法本意?
五、传统“思想—表达二分法”在AI时代承受压力
“思想—表达二分法”是《著作权法》中最核心、最基础的法律原则,也是判定侵权与否的“黄金标尺”。简而言之,《著作权法》只保护思想的“表达”,而不保护“思想”本身。随着全球化,这一原则被写入《与贸易有关的知识产权协定》(TRIPs)第9条第2款:“版权保护应延及表达,而不延及思想、程序、操作方法或数学概念本身。”中国作为WTO成员国,在《著作权法》及相关司法实践中也应严格遵循这一原则。
法律之所以如此小心翼翼地剥离思想与表达,是基于公共利益与个人激励的平衡。如果“思想”可以被垄断,文化的源头就会枯竭,其中蕴含的基础逻辑是:版权法只赋予作者对自己“劳动成果”(具体的表达)的垄断,而不允许其圈占“人类智慧的公有领域”(思想)。但是,在AI时代,生成式人工智能以及大模型技术本身所抓取、分析、利用的,不正是人类的所有智慧?其数据和算法相结合所带来的“涌现”,不也正是“人类智慧”?从这个角度来说,笔者认为,“思想—表达二分法”本身没有过时,但在AI时代如何理解,则成为了一个新的问题。
AIGC场景对传统版权领域的挑战,在于如何有效解释“思想—表达二分法”;尤其是随着AI技术的进步,提示词本身趋于简单化、同质化,而最终的作品则是对作者从不同的思考角度对AI工具进行反复提问,并经由人机协作后不断修订和完善的体现。以文字作品为例,尽管最终作品的80%有可能为机器生成,但是作品本身的逻辑、框架以及最终的“华彩”部分,均为作者自己完成。
正如上述部分法院判决将AI比作“画笔”或者“照相机“,笔者认为,AIGC的创作过程是一种“人类对机器的驯化”。AI模型是充满随机性和海量数据训练的“野马”,而人类的独特智力体现(通过提示词、参数、后期修改体现)则是“缰绳”。最终的作品是人类的意志和审美驯化AI的随机性后产生的固定表达。
此时,法律不应再问“你是否100%控制了马的每一步?”,而是“最终马跑出的路线,是否体现了你的意志和技巧?”
六、结论:如何重塑AIGC版权的保护边界
笔者认为,AIGC版权保护的边界,应且必须锚定于人类在创作过程中注入的“符合原创标准的智力体现与表达”上。这种“体现与表达”应被定义为:
一是构思的独特性,即超越“常规表达”的结构设定、角色定义或艺术构思。二是指令的个性化,即超越“简单罗列”的、具有“个性化特征”的风格指令、参数设置和体现了“个性判断”的原创选择。三是过程的迭代性,即超越“一次性输入”的、可证明的“多次调整”,以及经过“筛选、修改、编排”的、体现作者独立创作的过程。
如果上面的定义过于冗杂,以下则为更加直接的结论:
首先,简单的提示词绝对属于“思想”,不受保护。
其次,复杂的“结构化提示词”,如果本身包含了一段独创的故事、一段诗歌,或者极其独特的各种形容词的排列组合,那么提示词文本本身可能作为“文字作品”受保护,但这并不意味着通过其生成的图片/结果自动受到保护。
最后,能通过证据(图片、文本的修订记录)证明作者本人对AI工具最终生成内容的“原创性表达”施加了决定性影响的情况下,人类即成为是该作品的合法作者,其著作权应受法律保护。
笔者预测,未来,人机共创将会成为所有人文艺术领域的主流形态。以文字作品为例,未来的作者将会把主要的时间和精力放在构想本身,而大部分具体的语言组织可能都会由机器“代劳”。当具体的“遣词造句”由机器代劳时,判定作品“原创性”的重心将不可避免地发生从“表达层面”向“选择与安排层面”的迁移。
注释:
1 US Copyright Office Releases Part 2 of AI Report,https://www.akingump.com/en/insights/ai-law-and-regulation-tracker/us-copyright-office-releases-part-2-of-ai-report





京公网安备 11010502049464号