亞馬遜云科技推出配備72個英偉達Blackwell GPU的新實例 算力提升20倍快訊
亞馬遜云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200實例,Amazon EC2 P6-B200實例的GPU計算能力是其2.25倍,Amazon SageMaker HyperPod將支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實例。
【TechWeb】7月10日消息,為了加速推理模型、Agentic AI系統(tǒng)等新興生成式AI技術的發(fā)展,亞馬遜云科技宣布由NVIDIA Grace Blackwell Superchips加速的_Amazon EC2 P6e-GB200 UltraServer_現(xiàn)已正式可用。P6e-GB200 UltraServer專為訓練和部署最大規(guī)模、最復雜的AI模型而設計。
今年早些時候,亞馬遜云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200實例,支持多樣化的AI和高性能計算工作負載。
Amazon EC2 P6e-GB200 UltraServer是亞馬遜云科技迄今為止最強大的GPU產(chǎn)品,配備最多72個NVIDIA Blackwell GPU,這些GPU通過第五代NVIDIA NVLink互連,并作為單一計算單元運行。每臺UltraServer可提供高達360 petaflops的高密度FP8算力,以及13.4TB的高帶寬顯存(HBM3e)——相比P5en實例,在單個NVLink域內(nèi)的計算能力提升超過20倍,內(nèi)存容量提升超過11倍。Amazon EC2 P6e-GB200 UltraServer支持高達28.8 Tbps的第四代Elastic Fabric Adapter(EFAv4)網(wǎng)絡帶寬。
Amazon EC2 P6-B200實例為廣泛AI場景提供靈活選擇。每個實例配備8個通過NVLink互連的NVIDIA Blackwell GPU,擁有1.4TB高帶寬顯存和最高3.2 Tbps的EFAv4網(wǎng)絡帶寬,以及第五代Intel Xeon Scalable處理器。與Amazon EC2 P5en實例相比,Amazon EC2 P6-B200實例的GPU計算能力是其2.25倍,顯存容量為其1.27倍,顯存帶寬為其1.6倍。
目前,亞馬遜云科技通過多種部署路徑簡化Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實例的啟用過程,客戶可快速開始使用Blackwell GPU,同時保持其現(xiàn)有的運維模式。
Amazon SageMaker HyperPod將支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實例,并通過優(yōu)化使工作負載保持在同一NVLink域內(nèi),以實現(xiàn)性能最大化。亞馬遜云科技還在構(gòu)建一套完整的多層級恢復機制:Amazon SageMaker HyperPod可在同一NVLink域內(nèi)自動用預配置的備用實例替換故障節(jié)點。內(nèi)置儀表板將提供從GPU利用率、內(nèi)存使用情況到工作負載指標和UltraServer運行狀態(tài)的全面可視化信息。
同時,Amazon EC2 P6e-GB200 UltraServer也將通過NVIDIA DGX Cloud提供。DGX Cloud是一個統(tǒng)一的AI平臺,在各層架構(gòu)均經(jīng)過優(yōu)化,具備多節(jié)點AI訓練與推理能力,并集成英偉達完整的AI軟件棧。客戶可充分利用英偉達最新的性能優(yōu)化方案、基準測試方法和技術專長,以提升效率與性能。該平臺還提供靈活的服務期限選擇,以及由英偉達專家提供的全面支持與服務,助力客戶加速推進AI項目。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br>
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。