消息稱 DeepSeek-R2 AI 模型開發(fā)進(jìn)程因美國當(dāng)局英偉達(dá) H20 芯片出口限制而延遲快訊
多數(shù)用戶都是在英偉達(dá)的 H20 芯片上部署 / 運(yùn)行現(xiàn)有 DeepSeek-R1 模型,DeepSeek 使用了 5 萬塊 Hopper GPU 訓(xùn)練 R1 模型,DeepSeek 團(tuán)隊近幾個月一直在密集推進(jìn) R2 模型開發(fā)。
6 月 27 日消息,據(jù)外媒 The Information 報道,由于美國當(dāng)局策略致英偉達(dá) H20 芯片在中國內(nèi)地供應(yīng)短缺,繼而導(dǎo)致 DeepSeek-R2 AI 模型開發(fā)工作延遲。
注意到,DeepSeek 使用了 5 萬塊 Hopper GPU 訓(xùn)練 R1 模型,其中包括 3 萬塊 H20、1 萬塊 H800 和 1 萬塊 H100,這些顯卡由其投資方高毅資產(chǎn)(High-Flyer Capital Management)采購。
外媒援引兩位知情人士透露,DeepSeek 團(tuán)隊近幾個月一直在密集推進(jìn) R2 模型開發(fā),但 CEO 梁文鋒目前對模型的能力仍不滿意,內(nèi)部仍在繼續(xù)提升性能,相應(yīng)模型尚未準(zhǔn)備好正式投用。
此外,相應(yīng)報道同時指出,多數(shù)用戶都是在英偉達(dá)的 H20 芯片上部署 / 運(yùn)行現(xiàn)有 DeepSeek-R1 模型,隨著 H20 芯片遭美國當(dāng)局限制出口,除了令 DeepSeek R2 的研發(fā)更加困難外,也對現(xiàn)有 DeepSeek-R1 實(shí)際部署造成一定影響。(漾仔)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。