亞馬遜云科技全球上架Qwen3與DeepSeek-V3.1模型,更多細節披露快訊
在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1開放權重模型,亞馬遜云科技客戶現可使用上述系列開放權重模型,亞馬遜云科技始終相信為客戶提供豐富多樣的專有和開放權重AI模型選擇。
【TechWeb】9月19日消息,今日,亞馬遜云科技正式宣布,在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1開放權重模型,進一步擴展Amazon Bedrock上完全托管的行業領先模型陣容,這些模型現已在全球范圍內正式可用。
這是繼今年年初,Amazon Bedrock上架DeepSeek-R1開放權重模型后,再次上架中國技術團隊推出的大模型,也是Qwen系列模型首次上架該平臺。
隨著上架,借助亞馬遜云科技服務,Qwen3與DeepSeek-V3.1的影響力將擴展至亞馬遜云科技數百萬客戶。
目前,Amazon Bedrock上其他開放權重模型還包括來自Meta、Mistral AI的模型,以及8月OpenAI剛剛發布的2款模型。
亞馬遜云科技Amazon Bedrock總監Luis Wang表示:“開放權重模型代表著AI創新的重要前沿,這也是為什么我們不斷投入使亞馬遜云科技成為安全、規模化且具有成本效益地運行這些模型的最佳平臺。我們認為沒有一個模型能適合所有使用場景…很多客戶喜歡使用開源模型,而開源模型的一大優勢在于它能為用戶提供更大的靈活性去探索和使用。”
與此同時,亞馬遜云科技中國技術團隊也向TechWeb披露了更多這些開放權重大模型使用細節。
一次性上架5款開放權重模型
此次上架Amazon Bedrock的共有五款開放權重模型,其中Qwen3系列有四款,DeepSeek-V3.1一款:
* Qwen3-Coder-480B-A3B-Instruct和Qwen3-Coder-30B-A3B針對復雜的軟件工程場景進行優化,包括代碼生成和理解以及高級Agentic任務。這些模型不僅支持多種編程語言的代碼編寫,還能自主調用各類數字工具(如外部工具和應用程序)。
* Qwen-3-235B-A22B-Instruct-2507專為通用推理設計,在性能與效率間實現平衡,在代碼、數學和通用推理等任務中都表現出色。”混合專家”(MoE)模型在處理每個請求時只激活部分參數,這意味著針對特定任務或問題,他們只調用相關知識,從而實現高性能和高效率。
* Qwen3-32B(Dense)適用于在計算資源有限情況下的計算任務和應用程序,或者需要穩定、可預測性能的場景。與MoE模型類似專家團隊只在需要時才激活他們的特定專業知識不同,”Dense”模型通常規模更小,所有組件始終協同工作。
Qwen3-Coder-30B-A3B-Instruct和Qwen3-235B-A22B-Instruct-2507模型可即刻處理高達262K token的上下文長度。在單次對話中,相當于約20萬個字符或兩部完整的長篇小說的內容量。
DeepSeek-V3.1擁有6850億參數。參數可以理解為模型的”知識連接點”,是訓練過程中不斷調整的內部數值設置,幫助模型從數據中學習并做出預測。DeepSeek-V3.1每次任務只調用相關知識部分,在保持強大性能的同時優化了運行成本。DeepSeek-V3.1相比前代實現了顯著提升,尤其是推理能力和Agentic技能方面。
DeepSeek-V3.1支持多語言處理,在軟件開發、數學推理和數據分析等領域表現出色,能夠高效解決各類編程和技術挑戰。同時,該模型特別適合構建如AI Agents和流程自動化等Agentic問題解決任務。
目前,亞馬遜云科技客戶現可使用上述系列開放權重模型。這些模型具備多步驟工作流規劃的能力,可與工具和API集成,并能在單個任務中處理長上下文窗口,其中兩個通用模型還提供”思考”和”非思考”推理模式。
亞馬遜云科技大中華區產品部總經理陳曉建表示:“這次發布Qwen3和DeepSeek V3.1進一步豐富了Amazon Bedrock上的模型選擇,更好服務全球客戶。”
集成Amazon Bedrock企業級功能,降低使用門檻
Qwen3和DeepSeek-V3.1模型是由中國阿里巴巴和DeepSeek團隊推出的“開源”模型。與專有(商業)模型不同,開放權重模型讓開發者能夠深入了解模型權重,從而可以根據用戶需求進行定制化。
亞馬遜云科技大中華區產品部技術總監王曉野向TechWeb表示:“一些客戶更喜歡開放權重模型,因為它們在透明度和可定制性上更有優勢。比如MoE架構下,客戶可以看到激活的專家參數,從而推算出算力和成本,這種透明性對部分客戶很重要。另外,客戶還可以基于開放權重模型,利用自身數據進行二次訓練和定制,獲得更大的靈活性。”
通過在Amazon Bedrock上使用這些模型,客戶可以獲得企業級的安全保障,包括數據加密和嚴格的訪問控制,幫助客戶保持數據隱私和滿足合規要求。客戶對其數據擁有完全控制權,這意味著亞馬遜云科技不會與模型提供商共享客戶的模型輸入和輸出數據,這些數據也不會用于基礎模型的改進。
此外,客戶還可以設置安全保障措施,如亞馬遜云科技推薦的Amazon Bedrock Guardrails來檢測和防止模型幻覺。
事實上,除了Amazon Bedrock本身托管的模型之外,亞馬遜云科技還通過“亞馬遜云科技Marketplace”這一平臺提供了更豐富的開放權重模型。
王曉野介紹道:“亞馬遜云科技Marketplace上的這些模型和Amazon Bedrock的Serverless模式有區別,它們并沒有集成Amazon Bedrock上的企業級功能,比如agent相關的能力、Amazon Bedrock Guardrails、模型評估(Model Evaluation)等。”
這次發布的Qwen3和DeepSeek V3.1,都完整集成了Amazon Bedrock上的企業級功能,因此能夠真正讓客戶在生產環境中使用。這正是Amazon Bedrock與單純提供模型下載或調用的差別所在。Amazon Bedrock并不僅僅是提供模型API,它更是一個讓客戶把模型真正用到生產環境的平臺。
截至目前,通過與AI公司合作,Amazon Bedrock提供超過一百個基礎模型。Amazon Bedrock不僅提供開源權重模型,也提供專業(商業)模型,比如Amazon Nova,還有像Anthropic Claude這樣的閉源模型。
“沒有一款模型能夠適用于所有場景,客戶一定會根據需求來選擇最合適的模型。亞馬遜云科技始終相信為客戶提供豐富多樣的專有和開放權重AI模型選擇,對釋放客戶使用生成式AI進行創新至關重要”,陳曉建強調,未來,亞馬遜云科技也會不斷擴展Amazon Bedrock模型陣容,為更多客戶就近提供服務。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。