消息稱 DeepSeek-R2 AI 模型開發進程因美國當局英偉達 H20 芯片出口限制而延遲快訊
導讀
多數用戶都是在英偉達的 H20 芯片上部署 / 運行現有 DeepSeek-R1 模型,DeepSeek 使用了 5 萬塊 Hopper GPU 訓練 R1 模型,DeepSeek 團隊近幾個月一直在密集推進 R2 模型開發。
6 月 27 日消息,據外媒 The Information 報道,由于美國當局策略致英偉達 H20 芯片在中國內地供應短缺,繼而導致 DeepSeek-R2 AI 模型開發工作延遲。
注意到,DeepSeek 使用了 5 萬塊 Hopper GPU 訓練 R1 模型,其中包括 3 萬塊 H20、1 萬塊 H800 和 1 萬塊 H100,這些顯卡由其投資方高毅資產(High-Flyer Capital Management)采購。
外媒援引兩位知情人士透露,DeepSeek 團隊近幾個月一直在密集推進 R2 模型開發,但 CEO 梁文鋒目前對模型的能力仍不滿意,內部仍在繼續提升性能,相應模型尚未準備好正式投用。
此外,相應報道同時指出,多數用戶都是在英偉達的 H20 芯片上部署 / 運行現有 DeepSeek-R1 模型,隨著 H20 芯片遭美國當局限制出口,除了令 DeepSeek R2 的研發更加困難外,也對現有 DeepSeek-R1 實際部署造成一定影響。(漾仔)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。