Meta被曝助推數字盜版:30%訓練AI書籍遭二次傳播快訊
的盜版書籍訓練 AI 模型外,不過最新研究指出的二次上傳行為可能顛覆這一論點,中下載了 82TB 的盜版版權資料用于訓練其 LLaMA 人工智能模型。
3 月 27 日消息,科技媒體 WinBuzzer 昨日(3 月 26 日)發布博文,報道稱最新研究顯示,Meta 在數字圖書盜版鏈中的參與度遠超預期。
消息稱 Meta 公司使用 LibGen、Z-Library 等“影子圖書館”的盜版書籍訓練 AI 模型外,還通過 BitTorrent 重新上傳約 30% 的已下載書籍,客觀上延長了盜版作品的傳播周期。
專家指出,盡管 BitTorrent 默認會分片上傳數據,但 Meta 的上傳量異常偏高,涉嫌變相成為盜版網絡節點。
曾于今年 2 月報道,Meta 在法庭文件中聲稱,盡管其從“影子圖書館”中下載了 82TB 的盜版版權資料用于訓練其 LLaMA 人工智能模型,但公司員工已采取措施,確保在下載過程中未對任何文件進行“種子分享(seeding)”。
不過最新研究指出的二次上傳行為可能顛覆這一論點,澳大利亞前總理馬爾科姆?特恩布爾發現著作被盜用,斥其“極度不安”,美國普利策獎得主邁克爾?夏邦等已提起訴訟,法國出版商指控 Meta 的行為是“對版權作品的大規模掠奪”。
歐盟委員會已關注此事,可能依據《歐盟 AI 法案》嚴懲。若法院最終認定 Meta 需為訓練數據獲取正式授權,將重塑 AI 行業數據獲取規則。目前案件走向尚未明朗,但這場版權爭議注定成為數字時代知識產權保護的標桿性事件。(故淵)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。