AI抄襲紐約時報?微軟和OpenAI遭遇版權侵犯指控!
近日,《紐約時報》對微軟和OpenAI(ChatGPT的母公司)提起訴訟,指控他們侵犯版權和濫用該報的知識產權。
技術濫用
《紐約時報》在提交給法院的文件中表示,因微軟和OpenAI「非法複製和使用《紐約時報》獨特有價值的作品」,而導致報紙遭受了「數十億美元的損失」。
Beata Zawrzel/NurPhoto/Getty Images
《紐約時報》指責微軟和OpenAI創造了一種基於「大規模侵犯版權」的商業模式,稱它們的人工智慧系統「利用並在許多情況下保留了這些作品中,包含的大部分受版權保護的表達」。
大致意思就是,流行的人工智慧聊天機器人ChatGPT的創造者——OpenAI,正在濫用報紙的知識產權來訓練人工智慧的大型語言模型。
《紐約時報》稱,微軟公司在這其中也扮演了重要角色,不但投資OpenAI,並為其能夠訪問公司的Azure雲計算技術提供了便利條件。顯然,微軟公司和OpenAI應為「非法複製和使用《紐約時報》獨一無二的有價值的作品」而受到懲罰。
尋求合作
《紐約時報》在一份聲明中說,它「認識到人工智慧對公眾和新聞業的力量和潛力」,但又話鋒一轉表示,新聞材料應在獲得原始來源許可的情況下用於商業用途並獲取利益。「人工智慧在新聞搜索和寫作等面展現出的『無所不能』,是建立在獨立新聞和內容的基礎上,並一直在持續使用這些內容,問題是,我們和我們的同行以高昂的成本和相當的專業知識進行了報道、編輯和事實核查。」《紐約時報》說,我們的新聞和報道內容收版權法保護,如果微軟和OpenAI想要將我們的作品用於商業目的,法律要求他們首先獲得我們的許可。遺憾的是,他們沒有這樣做。
MIKE COPPOLA/GETTY IMAGES
《紐約時報》在訴訟中稱,用於訓練OpenAI最新大型語言模型的數據集「可能使用了數百萬本《紐約時報》擁有的作品」。OpenAI為其人工智慧工具提供了動力。訴狀稱,在其中一個數據集(稱為Common Crawl,被稱為「互聯網副本」)的2019年英文快照中,《紐約時報》網站是第三大最具代表性的信息來源,僅次於維基百科和美國專利文件資料庫。
《紐約時報》聲稱,由於人工智慧工具已經接受了內容方面的培訓,它們可以「生成一字不差地背誦《紐約時報》內容的輸出,對其進行仔細總結,並模仿其表達風格,正如數十個例子所證明的那樣……這些工具還錯誤地將虛假信息歸咎於《紐約時報》,」訴狀稱。
在訴狀中引用的一個例子中,ChatGPT向一名用戶提供了2012年普利策獎獲獎文章的前三段,此前該用戶在聊天中抱怨自己沒有付費,所以無法閱讀這篇文章。
同時微軟的必應搜索引擎(今年早些時候使用OpenAI的技術進行了升級)「複製並分類」了《紐約時報》的內容,以產生比傳統搜索引擎更長、更詳細的回復。
「在未經時報許可或授權的情況下提供時報內容,被告的工具破壞和損害了時報與讀者的關係,剝奪了時報的訂閱、許可、廣告和附屬收入,」訴狀稱。
OpenAI的代表在一份聲明中表示:「我們尊重內容創作者和所有者的權利,並致力於與他們合作,確保他們受益於人工智慧技術和新的收入模式。我們與《紐約時報》正在進行的對話富有成效,並建設性地向前推進,因此我們對這一事態發展感到驚訝和失望。我們希望能找到一個互惠互利的合作方式,就像我們與許多其他出版商所做的那樣。」
微軟方面對媒體的提問沒有給予回應。
管中窺豹
《紐約時報》僅是眾多向一些最先進的人工智慧模型背後的公司索賠的媒體機構之一,涉嫌使用媒體內容來訓練人工智慧程序的企業「不乏其人」。
眾所周知,OpenAI是ChatGPT的創建者,後者是一種大型的語言模型,可以根據用戶的提示生成用戶所需的內容。
Angela Weiss | AFP | Getty Images
它使用了價值數十億參數的信息,截至2021年,這些信息度是從公開的網路數據中獲得的。
媒體出版商和內容創作者發現,他們的素材正在被「盜用」,並被生成的人工智慧工具,如ChatGPT、Dall-E等重新拼湊後以貌似全新的面孔呈現在受眾面前。在許多情況下,這些人工智慧產生的內容,怎麼看,都會令人覺得與源素材有相似之處。
今年早些時候,喜劇演員莎拉·西爾弗曼(Sarah Silverman)和兩名作家在獨立但相關的訴訟中,於7月起訴Meta和OpenAI,聲稱這兩家公司的人工智慧語言模型在未經他們知情或同意的情況下,使用了他們書籍中的受版權保護的材料進行訓練。兩家公司都沒有對這起訴訟發表評論。去年11月,一名法官駁回了大部分訴訟請求。
今年9月,一群著名的小說作家與美國作家協會(Authors Guild)一起,對OpenAI提起了單獨的集體訴訟,聲稱該公司的技術非法使用了他們的版權作品。
OpenAI曾試圖減輕新聞出版商的擔憂。去年12月,該公司宣布與商業內幕網(Business Insider)、Politico以及歐洲媒體Bild和Welt的母公司Axel Springer建立合作關係,向這些公司支付費用,以得到OpenAI使用其內容的授權。
但即便如此,人工智慧這一新事物如雨後春筍般湧現,還是令出版商們顯得有些措手不及,他們擔心,隨著生成型人工智慧聊天機器人的出現,點擊進入新聞網站的人會減少,從而導致流量和收入的萎縮。
ref: