英偉達Blackwell GPU平臺即將登陸亞馬遜云科技快訊
亞馬遜云科技將提供NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU,Amazon HealthOmics和英偉達醫療保健團隊還合作推出生成式AI微服務,亞馬遜云科技將提供配置GB200 NVL72的英偉達Blackwell平臺。
【TechWeb】3月20日消息,亞馬遜云科技和英偉達宣布,英偉達在2024年GTC大會上推出的新一代NVIDIA Blackwell GPU平臺即將登陸亞馬遜云科技。亞馬遜云科技將提供NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU。
英偉達Blackwell在亞馬遜云科技上的應用,使得該平臺在應對資源密集型和數萬億參數語言模型等推理工作負載加速方面實現了巨大飛躍。
NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU是英偉達剛剛在2024年GTC大會推出的最新GPU產品。

新的NVIDIA B200 GPU 由 2080 億個晶體管組成,而NVIDIA GB200 包含了兩個 B200 GPU 和一個 Grace CPU。

Blackwell 在單芯片訓練方面的 FP8 性能是其上一代架構的 2.5 倍,在推理方面的 FP4 性能是其上一代架構的 5 倍。在具有 1750 億個參數的 GPT-3 大語言模型基準測試中,GB200 性能是 H100 的 7 倍,訓練速度是 H100 的 4 倍,成本和能耗上GB200 比 H100 降低了 25 倍。
據介紹,亞馬遜云科技將提供配置GB200 NVL72的英偉達Blackwell平臺,它配備72顆Blackwell GPU和36顆Grace CPU,通過第五代NVIDIA NVLink互連。當與亞馬遜云科技的EFA網絡、Amazon Nitro高級虛擬化系統和Amazon EC2 UltraClusters超大規模集群等技術結合時,客戶能夠輕松擴展至數千個GB200 Superchips。


NVIDIA GB200 NVL72 是一種多節點、液冷、機架級系統,利用 Blackwell 為萬億參數模型提供強力計算,在單個機架中可實現 720 petaflops 的 AI 訓練性能和1.4 exaflops 的AI推理性能。
在安全性方面,亞馬遜云科技的Nitro 系統、Amazon KMS、EFA加密 和 Blackwell 加密的集成將為客戶提供對其訓練數據和模型權重的端到端控制,從而為客戶在亞馬遜云科技上的生成式AI應用程序提供更強的安全性。
Blackwell也加入了雙方合作的Project Ceiba項目,該項目專為NVIDIA自身的AI研發工作設計,是一臺亞馬遜云科技上托管的采用DGX Cloud的AI超級計算機,它搭載了20,736顆GB200 Superchips芯片,并通過第四代EFA網絡擴展,為每個Superchip提供高達800 Gbps的低延遲、高帶寬網絡吞吐量,能夠提供414 exaflops的計算能力,與之前計劃在Hopper架構上構建Ceiba相比,性能提升了6倍。
同時,亞馬遜云科技與英偉達聯手,通過Amazon SageMaker與NVIDIA NIM推理微服務的整合,提供了高性能、低成本的生成式AI推理解決方案,該服務作為NVIDIA AI企業版的一部分提供。客戶可以利用這一組合在Amazon SageMaker中快速部署和運行已預編譯且對NVIDIA GPU進行優化的基礎模型,縮短生成式AI應用的推出時間。
亞馬遜云科技與英偉達還在利用計算機輔助的藥物發現領域進行合作拓展,推出了新的NVIDIA BioNeMo基礎模型,用于生成化學、蛋白質結構預測,以及理解藥物分子與目標的相互作用。這些新模型將很快在Amazon HealthOmics上提供,這是一個專為幫助醫療保健和生命科學組織存儲、查詢和分析基因組、轉錄組及其他組學數據而設計的專用服務。
Amazon HealthOmics和英偉達醫療保健團隊還合作推出生成式AI微服務,以推進藥物發現、醫療技術和數字健康領域的發展,該服務提供一個新的GPU加速的云端服務目錄,涵蓋生物學、化學、成像和醫療保健數據,以便醫療企業能夠在亞馬遜云科技上利用生成式AI的最新成果。
亞馬遜云科技首席執行官Adam Selipsky表示:“我們雙方的深入合作可以追溯到13年前,當時我們共同推出了世界上第一個亞馬遜云科技上的GPU云實例,而今天我們為客戶提供了最廣泛的英偉達GPU解決方案。英偉達的下一代Grace Blackwell處理器是生成式AI和GPU計算領域的標志性事件。當結合亞馬遜云科技強大的EFA網絡、Amazon EC2 UltraClusters的超大規模集群功能,以及我們獨有的Amazon Nitro高級虛擬化系統及其安全功能時,我們就能夠使客戶更快、更大規模且更安全地構建和運行具有數萬億參數的大型語言模型。”(果青)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。