99精品国产兔费观看久久99,青草香蕉视频,麻豆成人免费视频

中國AI模型震驚硅谷 DeepSeek為何一夜火出圈？快訊

TechWeb.com.cn 2025-01-28 10:32

分享到：

導讀

隨著中國AI大模型DeepSeek的強勢崛起，DeepSeek正式發布DeepSeek-R1大模型，中國AI公司深度求索（DeepSeek）發布的大模型DeepSeek-R1震動業界。

【TechWeb】1月28日消息，這兩天，中國AI公司深度求索（DeepSeek）發布的大模型DeepSeek-R1震動業界，該模型使用更低的成本和更小的算力規模，實現了足以匹敵美國頂尖AI模型的效果。

最新消息顯示，DeepSeek已經登頂了中國和美國的蘋果App Store應用商店，一舉超越ChatGPT。這一現象讓西方媒體都忍不住發文感嘆“中國AI模型震驚硅谷”。

據報道，高盛發布報告，隨著中國AI大模型DeepSeek的強勢崛起，對沖基金已開始觀望美國本土培育的AI模式熱潮是否能持續。報告還指出，對沖基金上周已開始撤離對科技股的押注。

美股市場周一遭遇科技股拋售狂潮，納指開盤重挫逾3.5%，芯片股集體走低。截至周一收盤，英偉達暴跌16.97%，市值蒸發近5900億美元，相當于跌去了三個AMD的市值。博通跌17.4%，AMD跌6.37%，阿斯麥跌5.75%，臺積電跌13.33%。

DeepSeek是什么？

DeepSeek成立于2023年7月17日，是一家創新型科技公司，由知名量化資管巨頭幻方量化創立，專注于開發先進的大語言模型（LLM）和相關技術。

幻方量化的掌門人梁文鋒是DeepSeek的創始人。他出生于廣東湛江，浙江大學畢業，擁有信息與電子工程學系本科和碩士學位，2008年起開始帶領團隊使用機器學習等技術探索全自動量化交易，2015年幻方量化正式成立。

2021年，幻方量化的資產管理規模突破千億大關，躋身國內量化私募領域的“四大天王”之列。2023年梁文鋒宣布正式進軍通用人工智能領域，創辦DeepSeek，專注于做真正人類級別的人工智能。

2024年5月，DeepSeek發布混合專家語言模型DeepSeek-V2。同年12月，DeepSeek-V3問世，這款性能優越且性價比極高的大語言模型，被硅谷同行譽為“來自東方的神秘力量”。

此前，雷軍千萬年薪挖角的95后AI“天才少女”羅福莉便是DeepSeek-V2的關鍵開發者之一。

據大象新聞報道，DeepSeek團隊不到140人，多來自清華、北大、北航等頂尖高校的應屆博士畢業生、在讀生以及碩士生。而且，團隊沒有“海歸”，完全本土人才。

DeepSeek為何爆火？

這兩天DeepSeek成為科技圈的關注焦點，主要原因在于其以極小的成本訓練出了可以和OpenAI的ChatGPT一較高下的AI大模型。

今年1月20日，DeepSeek正式發布DeepSeek-R1大模型，并同步開源模型權重。DeepSeek-R1在數學、代碼、自然語言推理等任務上的表現與OpenAI的O1模型正式版不相上下，并采用MIT許可協議，支持免費商用、任意修改和衍生開發。

據每日經濟新聞報道，DeepSeek-R1的預訓練費用只有557.6萬美元，僅是OpenAI GPT-4o模型訓練成本的不到十分之一。同時，DeepSeek公布了API的定價，每百萬輸入tokens 1元（緩存命中）/4元（緩存未命中），每百萬輸出tokens 16元。這個收費大約是OpenAI o1運行成本的三十分之一。

業內認為，DeepSeek正打破算力為王的行業規則。此前，OpenAI提出的Scaling Law被全球AI大模型廠商奉為圭臬，即計算規模越大，訓練數據量越多，模型越智能。這也促使英偉達等不斷研發擁有更強大算力的產品。而DeepSeek讓業內看到通過軟件架構及算法的革新，可能也是一條通往更高性能AI大模型的思路。

受此消息影響，美股周一納指開盤重挫逾3.5%，芯片股集體走低。截至周一收盤，英偉達、臺積電、博通、AMD、阿斯麥等均出現不同幅度的下跌，其中最受矚目的是英偉達暴跌16.97%，市值蒸發近5900億美元，相當于跌去了三個AMD的市值。

之后，英偉達發布聲明稱，“DeepSeek的研究成果展示了如何利用測試時計算擴展技術創建新模型，充分利用廣泛可用的模型和完全符合出口管制規定的算力。”言外之意，DeepSeek并未違反美國對于英偉達芯片的出口管制規定。

同時，英偉達還在聲明中表示，DeepSeek等AI公司的推理需要大量英偉達GPU（圖形處理器）和高性能網絡，DeepSeek的爆火表明市場對其芯片仍有需求。

據外媒報道，Meta成立了四個專門研究小組來研究國產大模型DeepSeek的工作原理，并基于此來改進旗下大模型Llama。其中兩個小組正在試圖了解幻方量化如何降低訓練和運行DeepSeek的成本。

需求爆火，DeepSeek被擠到宕機，創始人回應

隨著DeepSeek的火爆出圈，1月26日，該應用曾出現短時閃崩現象。

對此，DeepSeek回應稱，當天下午確實出現了局部服務波動，但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后，用戶訪問量激增，服務器一時無法滿足大量用戶的并發需求。

1月27日晚，DeepSeek服務狀態頁面顯示，DeepSeek網頁不可用，公司正在調查這一問題。多位網友表示，DeepSeek無法回答對話問題。

1月28日凌晨，DeepSeek于服務狀態頁面公告稱，近期DeepSeek線上服務受到大規模惡意攻擊，注冊可能繁忙，請稍等重試。已注冊用戶可以正常登錄，感謝理解和支持。

日前，梁文鋒曾在接受媒體采訪時表示，中國AI不可能永遠處在跟隨的位置。“我們經常說中國AI和美國有一兩年差距，但真實的gap是原創和模仿之差。如果這個不改變，中國永遠只能是追隨者，所以有些探索也是逃不掉的。”

他認為，英偉達的領先，不只是一個公司的努力，而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢，手里有路線圖。中國AI的發展，同樣需要這樣的生態。

DeepSeek 模型 AI 中國英偉達

分享到：

1.TMT觀察網遵循行業規范，任何轉載的稿件都會明確標注作者和來源；
2.TMT觀察網的原創文章，請轉載時務必注明文章作者和"來源：TMT觀察網"，不尊重原創的行為TMT觀察網或將追究責任；
3.作者投稿可能會經TMT觀察網編輯修改或補充。

麻豆国内精品欧美在线-麻豆国内精品久久久久久-麻豆国产在线观看一区二区-麻豆国产在线观看免费-麻豆国产原创-麻豆国产一区二区在线观看

中國AI模型震驚硅谷 DeepSeek為何一夜火出圈？快訊