五家出版巨頭聯(lián)手上陣,把馬克·扎克伯格本人列為被告。這場官司的核心爭議很直接:用來訓(xùn)練大語言模型的海量書籍,到底是"合理使用"還是"大規(guī)模盜版"?
誰告的,告什么
![]()
原告名單堪稱出版業(yè)全明星:阿歇特、麥克米倫、麥格勞-希爾、愛思唯爾、圣智五大出版集團(tuán),外加暢銷書作家斯科特·特羅。他們在集體訴訟中指控,Meta及其CEO扎克伯格"未經(jīng)授權(quán)復(fù)制并分發(fā)了數(shù)百萬部受版權(quán)保護(hù)的作品,未向作者或出版商提供任何補(bǔ)償,且完全明知其行為違反版權(quán)法"。
訴狀中有一句指向明確的指控:「扎克伯格本人親自授權(quán)并積極鼓勵(lì)了侵權(quán)行為。」
這不是Meta第一次因訓(xùn)練數(shù)據(jù)被告。2023年,另一批作者發(fā)起過版權(quán)侵權(quán)訴訟,但最終敗訴。LibGen案中也出現(xiàn)過扎克伯格" reportedly encouraged use of copyrighted works"(據(jù)報(bào)道鼓勵(lì)使用受版權(quán)保護(hù)作品)的說法。去年,英國一群作者也曾就Meta可能違反版權(quán)法發(fā)出警告。
Meta的防守:法院站我這邊
Meta發(fā)言人戴夫·阿諾德在回應(yīng)《紐約時(shí)報(bào)》時(shí)搬出了法院背書:「人工智能正在為個(gè)人和企業(yè)帶來變革性創(chuàng)新、生產(chǎn)力和創(chuàng)造力,法院已正確認(rèn)定,使用受版權(quán)保護(hù)的材料訓(xùn)練人工智能可構(gòu)成合理使用。」
這句話的底氣來自近期判例。在針對Anthropic的類似訴訟中,法官對版權(quán)侵權(quán)論點(diǎn)似乎不為所動(dòng),但提出了另一條路徑——將 piracy(盜版)作為作者向AI公司索賠的替代方案。
這暗示了當(dāng)前法律戰(zhàn)的關(guān)鍵分野:版權(quán)侵權(quán)的"合理使用"抗辯 vs. 數(shù)據(jù)來源本身的非法性。
辯論核心:技術(shù)需要 vs. 權(quán)利邊界
正方(Meta及AI公司)的邏輯鏈條:
大語言模型需要海量文本訓(xùn)練 → 受版權(quán)保護(hù)的作品是高質(zhì)量語料的主要來源 → 法院已認(rèn)可"合理使用"框架 → 技術(shù)創(chuàng)新收益大于個(gè)體權(quán)利損耗 → 行業(yè)慣例如此,改變規(guī)則將扼殺發(fā)展
反方(出版商與作者)的反擊點(diǎn):
訓(xùn)練數(shù)據(jù)規(guī)模達(dá)"數(shù)百萬部" → 零補(bǔ)償、零授權(quán) → 高管"親自授權(quán)"顯示主觀故意 → 2023年作者敗訴不等于出版商敗訴(原告主體不同,作品類型不同) → LibGen等盜版書庫的使用涉嫌"明知故犯"
一個(gè)關(guān)鍵細(xì)節(jié):訴狀特別強(qiáng)調(diào)扎克伯格的"personal authorization"(個(gè)人授權(quán))。這不是把責(zé)任推給某個(gè)技術(shù)團(tuán)隊(duì),而是直指最高決策層。如果這一指控被采信,將動(dòng)搖"公司行為 vs. 個(gè)人責(zé)任"的防火墻。
我的判斷:這是一場關(guān)于"成本轉(zhuǎn)嫁"的談判
出版商選擇此時(shí)集體起訴,時(shí)機(jī)精準(zhǔn)。2023年作者敗訴后,法律界對"AI訓(xùn)練=合理使用"的共識并未穩(wěn)固——Anthropic案中法官對盜版路徑的開放態(tài)度,留下了窗口。
更深層的博弈在于:AI公司的訓(xùn)練成本結(jié)構(gòu),是否必須包含版權(quán)采購?
目前大模型的競爭本質(zhì)是數(shù)據(jù)軍備競賽。如果法院最終要求為每本訓(xùn)練書籍付費(fèi),行業(yè)成本結(jié)構(gòu)將徹底重寫。出版商要的或許不是勝訴判決,而是一個(gè)定價(jià)基準(zhǔn)——就像音樂流媒體時(shí)代,唱片公司最終拿下的版權(quán)分成模式。
扎克伯格"親自授權(quán)"的指控,無論真假,都暴露了一個(gè)行業(yè)默契:在"先訓(xùn)練、后談判"的策略下,高管層對數(shù)據(jù)來源的灰色地帶心知肚明。出版商此刻把這句話寫進(jìn)訴狀,是在向陪審團(tuán)和輿論同時(shí)喊話——這不是技術(shù)中立,這是商業(yè)決策。
案件走向?qū)⑷Q于兩個(gè)法律技術(shù)問題:LibGen等盜版書庫的使用能否被證明;以及"合理使用"的邊界是否因"商業(yè)性AI平臺(tái)"而收縮。在此之前,所有AI公司的訓(xùn)練數(shù)據(jù)審計(jì)報(bào)告,都值得重新閱讀。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.