OpenAI官宣將發(fā)布自GPT-2以來(lái)的首個(gè)開(kāi)放權(quán)重語(yǔ)言模型,并具有推理功能快訊
我們計(jì)劃發(fā)布自 GPT-2 以來(lái)的首個(gè)開(kāi)放權(quán)重語(yǔ)言模型,開(kāi)放權(quán)重模型是不同的,鑒于我們知道這個(gè)模型將在發(fā)布后進(jìn)行修改。
4 月 1 日消息,OpenAI CEO 薩姆?奧爾特曼今日官宣,將在未來(lái)幾個(gè)月發(fā)布一個(gè)“強(qiáng)大的新開(kāi)放權(quán)重語(yǔ)言模型”,并具有推理功能。
我們計(jì)劃發(fā)布自 GPT-2 以來(lái)的首個(gè)開(kāi)放權(quán)重語(yǔ)言模型。
我們考慮這件事已經(jīng)很久了,但其他優(yōu)先事項(xiàng)占了上風(fēng)。現(xiàn)在感覺(jué)做這件事很重要。
發(fā)布前,我們將根據(jù)準(zhǔn)備的框架評(píng)估這個(gè)模型,就像我們會(huì)對(duì)任何其他模型做的那樣。鑒于我們知道這個(gè)模型將在發(fā)布后進(jìn)行修改,因此還會(huì)做額外的工作。
我們還有一些決定要做,所以將舉辦開(kāi)發(fā)者活動(dòng)來(lái)收集反饋,并在之后嘗試早期原型。我們將在幾周內(nèi)在舊金山開(kāi)始(舉辦開(kāi)發(fā)者活動(dòng)),隨后在歐洲和亞太地區(qū)舉行會(huì)議。
我們很期待看到開(kāi)發(fā)者們將如何構(gòu)建,以及大型公司和政府如何使用它,在他們更愿意自己運(yùn)行模型的地方。
到目前為止,用戶只能通過(guò) OpenAI 的界面或?qū)⑵?API 密鑰集成到他們的應(yīng)用中來(lái)使用其模型,這意味著模型本身保持秘密和專有。
然而,開(kāi)放權(quán)重模型是不同的。這些模型中預(yù)訓(xùn)練的參數(shù)(定義模型如何響應(yīng)的“權(quán)重”)是向公眾公開(kāi)共享的。開(kāi)發(fā)人員和研究人員可以下載它們,在本地運(yùn)行它們,針對(duì)特定用例進(jìn)行微調(diào),或?qū)⑺鼈儾迦氲阶远x應(yīng)用中。僅僅因?yàn)闄?quán)重是開(kāi)放的并不意味著就是開(kāi)源的,訓(xùn)練代碼、數(shù)據(jù)集和詳細(xì)日志可能仍然保持專有或未公開(kāi),因此可能并不是完全的開(kāi)源。
Meta 和 Mistral 等公司已經(jīng)發(fā)布了 Llama 和 Mixtral 等強(qiáng)大模型,而 DeepSeek、阿里巴巴和百川等新玩家也在推出可以與其匹敵的開(kāi)源模型。從學(xué)術(shù)研究人員到獨(dú)立開(kāi)發(fā)者,許多人開(kāi)始擁抱開(kāi)放權(quán)重模型,OpenAI 也是時(shí)候做出改變了。(汪淼)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為T(mén)MT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。