AI抄袭纽约时报?微软和OpenAI遭遇版权侵犯指控!
近日,《纽约时报》对微软和OpenAI(ChatGPT的母公司)提起诉讼,指控他们侵犯版权和滥用该报的知识产权。
技术滥用
《纽约时报》在提交给法院的文件中表示,因微软和OpenAI“非法复制和使用《纽约时报》独特有价值的作品”,而导致报纸遭受了“数十亿美元的损失”。
Beata Zawrzel/NurPhoto/Getty Images
《纽约时报》指责微软和OpenAI创造了一种基于“大规模侵犯版权”的商业模式,称它们的人工智能系统“利用并在许多情况下保留了这些作品中,包含的大部分受版权保护的表达”。
大致意思就是,流行的人工智能聊天机器人ChatGPT的创造者——OpenAI,正在滥用报纸的知识产权来训练人工智能的大型语言模型。
《纽约时报》称,微软公司在这其中也扮演了重要角色,不但投资OpenAI,并为其能够访问公司的Azure云计算技术提供了便利条件。显然,微软公司和OpenAI应为“非法复制和使用《纽约时报》独一无二的有价值的作品”而受到惩罚。
寻求合作
《纽约时报》在一份声明中说,它“认识到人工智能对公众和新闻业的力量和潜力”,但又话锋一转表示,新闻材料应在获得原始来源许可的情况下用于商业用途并获取利益。“人工智能在新闻搜索和写作等面展现出的‘无所不能’,是建立在独立新闻和内容的基础上,并一直在持续使用这些内容,问题是,我们和我们的同行以高昂的成本和相当的专业知识进行了报道、编辑和事实核查。”《纽约时报》说,我们的新闻和报道内容收版权法保护,如果微软和OpenAI想要将我们的作品用于商业目的,法律要求他们首先获得我们的许可。遗憾的是,他们没有这样做。
MIKE COPPOLA/GETTY IMAGES
《纽约时报》在诉讼中称,用于训练OpenAI最新大型语言模型的数据集“可能使用了数百万本《纽约时报》拥有的作品”。OpenAI为其人工智能工具提供了动力。诉状称,在其中一个数据集(称为Common Crawl,被称为“互联网副本”)的2019年英文快照中,《纽约时报》网站是第三大最具代表性的信息来源,仅次于维基百科和美国专利文件数据库。
《纽约时报》声称,由于人工智能工具已经接受了内容方面的培训,它们可以“生成一字不差地背诵《纽约时报》内容的输出,对其进行仔细总结,并模仿其表达风格,正如数十个例子所证明的那样……这些工具还错误地将虚假信息归咎于《纽约时报》,”诉状称。
在诉状中引用的一个例子中,ChatGPT向一名用户提供了2012年普利策奖获奖文章的前三段,此前该用户在聊天中抱怨自己没有付费,所以无法阅读这篇文章。
同时微软的必应搜索引擎(今年早些时候使用OpenAI的技术进行了升级)“复制并分类”了《纽约时报》的内容,以产生比传统搜索引擎更长、更详细的回复。
“在未经时报许可或授权的情况下提供时报内容,被告的工具破坏和损害了时报与读者的关系,剥夺了时报的订阅、许可、广告和附属收入,”诉状称。
OpenAI的代表在一份声明中表示:“我们尊重内容创作者和所有者的权利,并致力于与他们合作,确保他们受益于人工智能技术和新的收入模式。我们与《纽约时报》正在进行的对话富有成效,并建设性地向前推进,因此我们对这一事态发展感到惊讶和失望。我们希望能找到一个互惠互利的合作方式,就像我们与许多其他出版商所做的那样。”
微软方面对媒体的提问没有给予回应。
管中窥豹
《纽约时报》仅是众多向一些最先进的人工智能模型背后的公司索赔的媒体机构之一,涉嫌使用媒体内容来训练人工智能程序的企业“不乏其人”。
众所周知,OpenAI是ChatGPT的创建者,后者是一种大型的语言模型,可以根据用户的提示生成用户所需的内容。
Angela Weiss | AFP | Getty Images
它使用了价值数十亿参数的信息,截至2021年,这些信息度是从公开的网络数据中获得的。
媒体出版商和内容创作者发现,他们的素材正在被“盗用”,并被生成的人工智能工具,如ChatGPT、Dall-E等重新拼凑后以貌似全新的面孔呈现在受众面前。在许多情况下,这些人工智能产生的内容,怎么看,都会令人觉得与源素材有相似之处。
今年早些时候,喜剧演员莎拉·西尔弗曼(Sarah Silverman)和两名作家在独立但相关的诉讼中,于7月起诉Meta和OpenAI,声称这两家公司的人工智能语言模型在未经他们知情或同意的情况下,使用了他们书籍中的受版权保护的材料进行训练。两家公司都没有对这起诉讼发表评论。去年11月,一名法官驳回了大部分诉讼请求。
今年9月,一群著名的小说作家与美国作家协会(Authors Guild)一起,对OpenAI提起了单独的集体诉讼,声称该公司的技术非法使用了他们的版权作品。
OpenAI曾试图减轻新闻出版商的担忧。去年12月,该公司宣布与商业内幕网(Business Insider)、Politico以及欧洲媒体Bild和Welt的母公司Axel Springer建立合作关系,向这些公司支付费用,以得到OpenAI使用其内容的授权。
但即便如此,人工智能这一新事物如雨后春笋般涌现,还是令出版商们显得有些措手不及,他们担心,随着生成型人工智能聊天机器人的出现,点击进入新闻网站的人会减少,从而导致流量和收入的萎缩。
ref: