OpenAI GPT-6 訓(xùn)練規(guī)模將創(chuàng)歷史新高:預(yù)估 10 萬張 H100 GPU快訊
OpenAI 在訓(xùn)練 GPT-3 時(shí)使用了約 1 萬塊 GPU,報(bào)道稱 OpenAI 在介紹 GPT-4.5 模型的視頻中,意外泄露了 GPT-6 訓(xùn)練可能需要的 GPU 數(shù)量。
IT之家 3 月 1 日消息,科技媒體 smartprix 昨日(2 月 28 日)發(fā)布博文,報(bào)道稱 OpenAI 在介紹 GPT-4.5 模型的視頻中,意外泄露了 GPT-6 訓(xùn)練可能需要的 GPU 數(shù)量,暗示其規(guī)模將遠(yuǎn)超以往。
IT之家注:在 GPT-4.5 模型介紹視頻的 2 分 26 秒處,OpenAI 展示 GPT 4.5 功能的聊天記錄中,出現(xiàn)了“Num GPUs for GPT 6 Training”(訓(xùn)練 GPT-6 所需的 GPU 數(shù)量)的字樣。
雖然視頻中未對此進(jìn)行任何解釋,但“Num”可能暗示了一個(gè)前所未有的數(shù)字,該媒體推測高達(dá) 10 萬塊 GPU。
此前有消息稱,OpenAI 在訓(xùn)練 GPT-3 時(shí)使用了約 1 萬塊 GPU,而隨著模型的不斷迭代,對計(jì)算資源的需求也在不斷增加。
內(nèi)部代號(hào)為“Orion”的 GPT 4.5 在自然度和減少“幻覺”方面取得了重大進(jìn)展,其參數(shù)量可能超過 3 到 4 萬億。據(jù)推測,GPT 4.5 的訓(xùn)練使用了 3 萬到 5 萬塊 NVIDIA H100 GPU,訓(xùn)練成本約 7.5 億到 15 億美元(IT之家備注:當(dāng)前約 54.69 億到 109.37 億元人民幣)。
截圖中“Num”的含義尚不明確,它可能代表“Numerous”(大量),暗示 GPT-6 的訓(xùn)練規(guī)模遠(yuǎn)超以往。當(dāng)然,這也有可能只是 OpenAI 的一個(gè)煙霧彈,就像之前用“Strawberry”(草莓)作為 o1 系列的代號(hào)一樣。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。