OpenAI 發(fā)布 GPT-4o 模型卡:概述 AI 安全和風險緩解措施快訊
除了針對 GPT-4 和 GPT-4V 進行的安全評估和緩解措施外,OpenAI 表示 GPT-4o 模型的核心就是準備框架(Preparedness Framework),OpenAI 在模型和系統(tǒng)層面都實施了保障措施。
IT之家 8 月 10 日消息,OpenAI 公司于 8 月 8 日發(fā)布報告,概述了 GPT-4o 模型的系統(tǒng)卡(System Card),介紹了包括外部紅隊(模擬敵人攻擊)、準備框架(Preparedness Framework)在內(nèi)的諸多細節(jié)。
OpenAI 表示 GPT-4o 模型的核心就是準備框架(Preparedness Framework),這是一種評估和降低人工智能系統(tǒng)相關(guān)風險的系統(tǒng)方法。IT之家從報道中獲悉,該框架主要用于識別網(wǎng)絡安全、生物威脅、說服和模型自主性等領域的潛在危險。
除了針對 GPT-4 和 GPT-4V 進行的安全評估和緩解措施外,OpenAI 還針對 GPT-4o 的音頻功能開展了更多安全工作。
評估的風險包括揚聲器識別、未經(jīng)授權(quán)的語音生成、受版權(quán)保護內(nèi)容的潛在生成、無根據(jù)推斷以及不允許的內(nèi)容。基于這些評估結(jié)果,OpenAI 在模型和系統(tǒng)層面都實施了保障措施。
OpenAI 還與 100 多名外部紅隊人員合作,在向公眾發(fā)布模型之前對其進行評估。紅隊人員將進行探索性的能力發(fā)現(xiàn),評估模型帶來的新的潛在風險,并對緩解措施進行壓力測試。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br>
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。