人工智能初创公司Anthropic已同意支付15亿美元,以了结其因使用盗版文本而遭遇的版权诉讼,为面临来自作者和出版商之知识产权诉讼的科技公司树立了先例。
根据周五提交的法庭文件,这项和解须经负责此案的旧金山联邦法官批准,将成为“有记录以来公开报道的最大版权追回”。
多位作者提起了这起集体诉讼,称 Anthropic 从“盗版网站”(包括 Library Genesis 与 Pirate Library Mirror)下载了46.5万本书籍及其他文本,并将其用于训练大型语言模型。
如果未能达成协议,案件将走向审判,赔偿金额可能高达1万亿美元。这将使Anthropic这家成立四年的初创公司破产;该公司获亚马逊(Amazon)和谷歌(Google)支持,近期估值为1700亿美元。
这起案件是多起针对包括OpenAI和Meta在内的人工智能公司的诉讼之一,指控这些公司在训练其模型时不当使用受版权保护的作品。
这些结果将有助于确定作者因其作品被使用而获得的补偿方式,并可能对人工智能公司训练模型的方法以及其开发成本产生重大影响。
美国作家协会(Authors Guild)首席执行官玛丽•拉森伯格(Mary Rasenberger)表示,周五达成的和解向人工智能行业发出了“强烈信号”:当他们为训练AI而盗用作者作品、从那些最无力承受损失的人那里攫取利益时,将面临严重后果。
Anthropic与其他人工智能公司声称,用受版权保护的书籍训练模型属于“合理使用”,并辩称其模型将原作转化为具有新的意义。
今年6月,加利福尼亚联邦地区法院裁定,Anthropic以这种方式使用部分受版权保护的作品属于合理使用。但法院认定,存储盗版作品“本质上且不可挽回地构成侵权”,为周五的和解铺平了道路。
周五的裁决还意味着,Anthropic必须销毁其从 Library Genesis 和 Pirate Library Mirror 下载的数据集。
“今年6月,地区法院就人工智能开发与版权法作出里程碑式裁决,认定Anthropic用于训练AI模型的方法构成合理使用。若获批准,今日的和解将了结原告剩余的既有主张。”Anthropic副总法律顾问阿帕尔娜•斯里达尔(Aparna Sridhar)在一份声明中表示。
她补充说:“我们始终坚定致力于开发安全的人工智能系统,帮助个人与组织拓展能力、推进科学发现并解决复杂问题。”