本周一(8月19日),人工智能初创公司Anthropic在加州联邦法院遭到集体诉讼,被指控侵犯版权。
Anthropic由前OpenAI研究高管创立,其最大的投资者是亚马逊公司,它还收获了包括谷歌和Salesforce公司在内的支持。
违法窃取
有三位作者在递交给加州联邦法院的一份文件中写道,Anthropic通过窃取数十万本受版权保护的书籍,建立了规模庞大的业务。Anthropic窃取的内容就包含了他们的作品。
作家Andrea Bartz、Charles Graeber和Kirk Wallace Johnson在诉讼中声称,“Anthropic商业模式的一个重要组成部分——旗舰Claude系列的大型语言模型,是对版权作品的大规模盗窃”。
Claude与OpenAI的ChatGPT和谷歌的Gemini一样,是去年人气爆发式增长的聊天机器人之一。在这起诉讼之前,Anthropic于6月推出了迄今为止最强大的人工智能模型Claude 3.5 Sonnet。
诉讼中写道,版权法禁止Anthropic所做的事情:它从盗版和非法网站下载和复制数十万本受版权保护的书籍,进行了复制,并将这些盗版版本输入其模型。
对抗还是合作?
随着人工智能生成的内容变得越来越普遍,许多出版商和媒体都在积极努力保护自己的业务。
去年10月,Anthropic就有过一次被起诉的经历。当时,根据田纳西州联邦法院的一份文件,环球音乐起诉这家初创公司“系统而广泛地侵犯了他们的歌词版权”。其他音乐出版商,如Concord和ABKCO也在原告之列。
去年12月,《纽约时报》对微软和OpenAI提起诉讼,指控其新闻内容出现在ChatGPT培训数据中侵犯了知识产权。《芝加哥论坛报》和其他七家报纸也在今年4月份提起了类似诉讼。
今年6月,美国历史最悠久的非营利新闻机构调查报道中心(Center for Investigative Reporting)在联邦法院起诉OpenAI及其主要支持者微软侵犯版权。
在经历了这些起案件后,人工智能公司和媒体公司已经开始逐渐寻得一个平衡点。一些新闻机构开始与人工智能初创公司联手。
今年5月,OpenAI宣布与新闻集团建立合作伙伴关系,允许OpenAI访问来自《华尔街日报》《市场观察》《巴伦周刊》《纽约邮报》和其他出版物的当前和存档文章。Reddit也在5月宣布与OpenAI合作,允许后者公司在Reddit内容上训练其AI模型。
6月,OpenAI和《时代》杂志宣布了一项“多年内容协议”,该协议将允许OpenAI访问《时代》杂志100多年历史上的当前和存档文章。OpenAI将能够在其ChatGPT聊天机器人中显示《时代》杂志的内容,以回答用户的问题,并使用《时代》杂志的内容“增强其产品”,或者很可能用于训练其人工智能模型。
今年7月,Perplexity AI为出版商推出了一种收入分成模式。包括《财富》《时代》《企业家》《德克萨斯论坛报》《明镜周刊》在内的媒体和内容平台率先加入了该公司的“出版商计划”。
最新的案例是在本周二(8月20日),OpenAI宣布与康泰纳仕集团(Cond Nast)达成合作伙伴关系,ChatGPT和SearchGPT将展示来自《Vogue》《纽约客》《CondéNast Traveler》等媒体的内容。