中國移動建成全球運營商最大單集群智算中心:超1.8萬張國產GPU快訊
導讀
該集群也是繼中國移動智算中心(呼和浩特)(全球運營商最大單體智算中心)上線運行后,該智算中心通過把所有AI加速卡整合為一個集群,該智算中心單集群內配備了超過18000張AI加速卡。
9月6日消息,近日,中國移動智算中心(哈爾濱)正式宣布上線投產,成為全球運營商最大單集群智算中心。
該智算中心單集群內配備了超過18000張AI加速卡,智能算力規模高達6.9EFLOPS。憑借其單集群算力規模之最、國產化網絡設備組網規模之最,傲視群雄。
此項集群規模不僅采用了高性能無損網絡、全調度以太網GSE1.0、融合分級存儲等一系列創新技術,還搭載了移動云智算平臺和智管平臺,支持萬卡并行訓練、斷點續訓、AI任務全生命周期管理及分鐘級故障定界定位等功能。這些功能使得集群算效與能效均達到了行業領先水平。
該集群也是繼中國移動智算中心(呼和浩特)(全球運營商最大單體智算中心)上線運行后,中國移動打造的業內首個端到端使用全國產設備的超大規模智算集群,標志著我國國產芯片商用部署達到了新的高度。
該智算中心通過把所有AI加速卡整合為一個集群,并運用先進的智算網絡技術,將上萬塊GPU芯片高效拼接,數據訓練完成時間縮短了20%,滿足萬億參數大模型的訓練需求。(隨心)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。