浪潮信息趙帥:未來一切計算皆AI,構建開放算力模組規范至關重要快訊
開放計算模組規范(OCM) 規范的正式啟動,浪潮信息最新一代基于OAM規范的AI服務器NF5698G7支持多種基于OAM規范的開放加速芯片,目前開放計算規范OAM已成為全球最多高端AI加速芯片遵循的統一設計標準。
【TechWeb】8月12日消息,2024開放計算中國峰會上,開放算力模組(OCM)規范正式啟動立項,首批成員包括中國電子技術標準化研究院、浪潮信息、Intel、AMD、百度、小紅書、聯想、超聚變等,旨在打造國內首個服務器計算模組設計規范,構建CPU統一算力底座。

開放計算模組規范(OCM) 規范的正式啟動,旨在建立基于處理器的標準化算力模組單元,通過統一不同處理器算力單元對外高速互連、管理協議、供電接口等,實現不同架構處理器芯片兼容,構建CPU的統一的算力底座,以解決CPU生態挑戰問題,方便客戶根據人工智能、云計算、大數據等多樣化應用場景,靈活、快速匹配最適合的算力平臺,推動算力產業高質量快速發展。
為何要構建“OCM”規范?
在談及“OCM”規范發起的初衷時,浪潮信息服務器產品線總經理趙帥表示,現在,無論是手機、電腦、邊緣設備、CPU服務器、加速服務器都具有了AI計算的能力,也都在承載著多樣化的AI應用。AI算力已經深入到千行百業,滲透進每一個計算設備里,面向人工智能的算力范式不斷革新。通用算力也要具有AI計算的能力,可以說“未來一切計算皆AI”。
在智算時代背景下,CPU算力單元應用越來越豐富,除了大數據、關鍵計算、科學計算外,也要承擔AI應用的重要任務,這是CPU算力單元的重大機遇。
與此同時,隨著應用范式的多樣化,CPU呈現了多元化發展方向。目前x86、ARM、RISC-V等不同架構的CPU處理器百花齊放,僅在中國,目前就有10多種CPU處理器,不同CPU協議標準不統一,系統功耗、總線速率、電流密度不斷提升,導致硬件開發、固件適配、部件測試資源等時間激增,給算力系統設計帶來巨大挑戰。
趙帥強調:“需要構建一個CPU的統一算力底座,解決CPU計算的效率問題。”
“OCM”規范的思路就是把原來一個緊耦合式的服務器架構拆散,以CPU和內存作為最小的算力單元,標準化高速和低速的互連接口。這樣,未來不同的算力平臺,只更換計算的模組,就可以實現從芯片到算力快速的落地應用。
通過這種標準化的算力模組,讓算力可以快速抵達用戶,讓用戶可以快速地利用最先進的算力。
“OCM”規范的價值和意義
浪潮信息服務器產品部產品規劃經理羅劍認為,隨著OCM規范的啟動,對算力上游廠商、終端用戶、系統集成商都大有裨益。
對于上游廠商來說,這個規范可以讓他們在做處理器的同時,把這個算力模塊做出來,新的平臺可以快速地在系統上面去做集成。
對于終端用戶來說,這種標準化可以實現對多元算力的統一管理、統一運維,管理復雜性極大降低了。
對于系統集成商來說,算力標準化后,就可以在不同的系統里應用統一的算力模塊,類似于硬盤一樣,一個系統里面可以支持多家的硬盤,一樣的道理,未來一個系統里面就可以支持多元算力平臺。
事實上,這不是浪潮信息首次參與發起相關行業規范。此前,浪潮信息就參與和支持了針對超大規模深度學習訓練的AI加速卡的“開放加速規范OAM”。
“OAM”構建了一個統一的加速芯片底座,解決了單個服務器內多元AI加速卡形態和接口不統一,高速互連效率低,研發周期長等問題,促進了加速算力單元接口的統一和生態的完善。
目前開放計算規范OAM已成為全球最多高端AI加速芯片遵循的統一設計標準,全球20多家芯片企業支持開放加速規范,為AI芯片企業節省研發時間6個月以上,為整體產業研發投入節省數十億元,極大地降低了AI算力產業創新的難度,加速高質量AI算力普惠發展。
浪潮信息最新一代基于OAM規范的AI服務器NF5698G7支持多種基于OAM規范的開放加速芯片,并為用戶構建了一個千卡液冷集群,支持超千億參數量的AI大模型訓練。
目前,OAM規范還在持續迭代,未來基于OAM2.0規范的AI加速卡將支持1024張加速卡的卡間互聯,突破大模型互聯瓶頸。
談到剛剛啟動的OCM規范,趙帥表示:“開放計算對于智算時代有非常重要的意義和價值,要用開放應對多元算力的挑戰。OCM是國內首個服務器模組設計規范,希望更多的行業伙伴以及更多的用戶參與進來,真正讓多元的統一算力模組盡快地走進每一個用戶的機房當中?!?br>
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。