翻译:赵轩 知产财经
知产财经获悉,近日,OpenAI要求法官驳回《纽约时报》对其提起的部分诉讼,指控该媒体公司“花钱雇人入侵OpenAI的产品”如 ChatGPT,以生成 100 个侵犯版权的案例。
据悉,在周一向曼哈顿联邦法院提交的一份文件中,OpenAI写道,《纽约时报》花了“数以万计的尝试才产生了高度异常的结果”,而且该公司使用了“公然违反OpenAI使用条款的欺骗性提示”。
“正常人不会以这种方式使用 OpenAI 的产品。”OpenAI 在文件中写道。
OpenAI 在文件中指控的“黑客攻击”也可以称为“提示工程”(prompt engineering)或“红队”(red-teaming) ,这是人工智能信任和安全团队、伦理学家、学者和科技公司“压力测试”人工智能系统漏洞的一种常见方式。这是人工智能行业的一种常见做法,也是提醒公司注意其系统问题的一种流行方式,类似于网络安全专业人员对公司网站弱点进行的压力测试。
“在这份文件中,OpenAI没有质疑(也不能质疑)他们在未经许可的情况下,复制了《纽约时报》数百万的作品来构建和支持其商业产品,”《纽约时报》的首席律师、Susman Godfrey的合伙人Ian Crosby在给CNBC的一份声明中说道。
Ian Crosby补充道:“OpenAI错误地描述为黑客的一种行为,其实只是使用OpenAI的产品来寻找他们窃取和复制《纽约时报》版权作品的证据,这正是我们的发现。事实上,OpenAI 的抄袭规模远远大于诉状中列出的100多个例子。”
OpenAI 的隐私政策规定,该公司将出于各种原因监控人们对其服务的查询和使用,包括(根据设置和付款计划)可能对未来的模型进行培训。尽管如此,《纽约时报》的律师Crosby认为:“OpenAI的回应显示他们正在跟踪用户的查询和输出,这尤其令人惊讶,因为他们声称不会这样做。”
Crosby还质疑了 ChatGPT 制造商向法庭提出的论点,即《纽约时报》提出申诉的时间过长,“OpenAI一直秘而不宣,刻意隐瞒其产品的运作方式,现在却声称提出侵权索赔或追究其责任为时已晚,我们不敢苟同。”
据悉,《纽约时报》曾于2023年12月起诉 OpenAI 及其支持者微软公司,指控这两家公司在未经许可的情况下盗用《纽约时报》的网站来训练大型语言模型,并要求微软和 OpenAI 承担数十亿美元的赔偿责任。
《纽约时报》认为,OpenAI 的技术(微软正在其软件和云帝国中应用该技术)可以允许用户有效绕过报纸的付费墙,通过要求聊天机器人提供大段报道来免费阅读新闻,从而骗取报纸的订阅费。
然而,OpenAI 本周反击了这些说法,并要求法院驳回此案,Open AI否认 ChatGPT 可以绕过付费墙,还补充说,人们无论如何都不会使用聊天机器人来阅读发表的文章。“在现实世界中,人们并没有将 ChatGPT 或任何其他 OpenAI 产品用于这一目的,他们也不能这样做。”
过去,OpenAI 曾表示,如果没有版权作品,“不可能”训练出顶尖的人工智能模型。OpenAI在上个月向英国上议院提交的一份文件中写道:“由于如今的版权几乎涵盖了人类的每一种表达方式,包括博客文章、照片、论坛帖子、软件代码碎片和政府文件,因此如果不使用受版权保护的材料,就不可能训练出当今领先的人工智能模型。”
“将训练数据限制在一个多世纪前创作的公共领域书籍和图纸上,可能会产生有趣的实验,但无法提供满足当今公民需求的人工智能系统。”OpenAI 在文件中称。
就在上个月,OpenAI 首席执行官Sam Altman在瑞士达沃斯表示,他对《纽约时报》的诉讼感到“惊讶”,并称 OpenAI 的模型并不需要在出版商的数据上进行训练。
虽然一家出版商可能不会影响 ChatGPT 的运营能力,但 OpenAI 的文件表明,许多出版商选择退出的决定可能会产生影响。最近几个月,该公司开始寻求出版商允许将内容用作训练数据。
该公司已经与拥有Business Insider、Morning Brew和其他媒体的德国媒体集团阿克塞尔·斯普林格(Axel Springer)达成了协议,据报道,该公司还在与美国有线电视新闻网(CNN)、福克斯公司(Fox Corp.)和《时代周刊》(Time)进行谈判,以获得他们作品的授权。
OpenAI 在申请文件和博客文章中强调了其针对出版商的退出程序,程序允许出版商禁止该公司的网络爬虫访问其网站。但在文件中,OpenAI 表示这些内容对于训练当今的人工智能模型至关重要。
该公司写道:“我们期待着继续开发更多机制,让权利人有权选择退出训练,同时我们也积极与权利人合作,寻求互惠互利的安排,以获取以其他方式无法访问的资料,并以超出版权法允许的方式展示内容。”