Meta被曝助推數(shù)字盜版:30%訓(xùn)練AI書籍遭二次傳播快訊
的盜版書籍訓(xùn)練 AI 模型外,不過最新研究指出的二次上傳行為可能顛覆這一論點(diǎn),中下載了 82TB 的盜版版權(quán)資料用于訓(xùn)練其 LLaMA 人工智能模型。
3 月 27 日消息,科技媒體 WinBuzzer 昨日(3 月 26 日)發(fā)布博文,報(bào)道稱最新研究顯示,Meta 在數(shù)字圖書盜版鏈中的參與度遠(yuǎn)超預(yù)期。
消息稱 Meta 公司使用 LibGen、Z-Library 等“影子圖書館”的盜版書籍訓(xùn)練 AI 模型外,還通過 BitTorrent 重新上傳約 30% 的已下載書籍,客觀上延長(zhǎng)了盜版作品的傳播周期。
專家指出,盡管 BitTorrent 默認(rèn)會(huì)分片上傳數(shù)據(jù),但 Meta 的上傳量異常偏高,涉嫌變相成為盜版網(wǎng)絡(luò)節(jié)點(diǎn)。
曾于今年 2 月報(bào)道,Meta 在法庭文件中聲稱,盡管其從“影子圖書館”中下載了 82TB 的盜版版權(quán)資料用于訓(xùn)練其 LLaMA 人工智能模型,但公司員工已采取措施,確保在下載過程中未對(duì)任何文件進(jìn)行“種子分享(seeding)”。
不過最新研究指出的二次上傳行為可能顛覆這一論點(diǎn),澳大利亞前總理馬爾科姆?特恩布爾發(fā)現(xiàn)著作被盜用,斥其“極度不安”,美國(guó)普利策獎(jiǎng)得主邁克爾?夏邦等已提起訴訟,法國(guó)出版商指控 Meta 的行為是“對(duì)版權(quán)作品的大規(guī)模掠奪”。
歐盟委員會(huì)已關(guān)注此事,可能依據(jù)《歐盟 AI 法案》嚴(yán)懲。若法院最終認(rèn)定 Meta 需為訓(xùn)練數(shù)據(jù)獲取正式授權(quán),將重塑 AI 行業(yè)數(shù)據(jù)獲取規(guī)則。目前案件走向尚未明朗,但這場(chǎng)版權(quán)爭(zhēng)議注定成為數(shù)字時(shí)代知識(shí)產(chǎn)權(quán)保護(hù)的標(biāo)桿性事件。(故淵)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。