中國AI模型震驚硅谷 DeepSeek為何一夜火出圈?快訊
隨著中國AI大模型DeepSeek的強勢崛起,DeepSeek正式發布DeepSeek-R1大模型,中國AI公司深度求索(DeepSeek)發布的大模型DeepSeek-R1震動業界。
【TechWeb】1月28日消息,這兩天,中國AI公司深度求索(DeepSeek)發布的大模型DeepSeek-R1震動業界,該模型使用更低的成本和更小的算力規模,實現了足以匹敵美國頂尖AI模型的效果。
最新消息顯示,DeepSeek已經登頂了中國和美國的蘋果App Store應用商店,一舉超越ChatGPT。這一現象讓西方媒體都忍不住發文感嘆“中國AI模型震驚硅谷”。

據報道,高盛發布報告,隨著中國AI大模型DeepSeek的強勢崛起,對沖基金已開始觀望美國本土培育的AI模式熱潮是否能持續。報告還指出,對沖基金上周已開始撤離對科技股的押注。
美股市場周一遭遇科技股拋售狂潮,納指開盤重挫逾3.5%,芯片股集體走低。截至周一收盤,英偉達暴跌16.97%,市值蒸發近5900億美元,相當于跌去了三個AMD的市值。博通跌17.4%,AMD跌6.37%,阿斯麥跌5.75%,臺積電跌13.33%。
DeepSeek是什么?
DeepSeek成立于2023年7月17日,是一家創新型科技公司,由知名量化資管巨頭幻方量化創立,專注于開發先進的大語言模型(LLM)和相關技術。
幻方量化的掌門人梁文鋒是DeepSeek的創始人。他出生于廣東湛江,浙江大學畢業,擁有信息與電子工程學系本科和碩士學位,2008年起開始帶領團隊使用機器學習等技術探索全自動量化交易,2015年幻方量化正式成立。
2021年,幻方量化的資產管理規模突破千億大關,躋身國內量化私募領域的“四大天王”之列。2023年梁文鋒宣布正式進軍通用人工智能領域,創辦DeepSeek,專注于做真正人類級別的人工智能。
2024年5月,DeepSeek發布混合專家語言模型DeepSeek-V2。同年12月,DeepSeek-V3問世,這款性能優越且性價比極高的大語言模型,被硅谷同行譽為“來自東方的神秘力量”。
此前,雷軍千萬年薪挖角的95后AI“天才少女”羅福莉便是DeepSeek-V2的關鍵開發者之一。
據大象新聞報道,DeepSeek團隊不到140人,多來自清華、北大、北航等頂尖高校的應屆博士畢業生、在讀生以及碩士生。而且,團隊沒有“海歸”,完全本土人才。
DeepSeek為何爆火?
這兩天DeepSeek成為科技圈的關注焦點,主要原因在于其以極小的成本訓練出了可以和OpenAI的ChatGPT一較高下的AI大模型。
今年1月20日,DeepSeek正式發布DeepSeek-R1大模型,并同步開源模型權重。DeepSeek-R1在數學、代碼、自然語言推理等任務上的表現與OpenAI的O1模型正式版不相上下,并采用MIT許可協議,支持免費商用、任意修改和衍生開發。

據每日經濟新聞報道,DeepSeek-R1的預訓練費用只有557.6萬美元,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。同時,DeepSeek公布了API的定價,每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個收費大約是OpenAI o1運行成本的三十分之一。

業內認為,DeepSeek正打破算力為王的行業規則。此前,OpenAI提出的Scaling Law被全球AI大模型廠商奉為圭臬,即計算規模越大,訓練數據量越多,模型越智能。這也促使英偉達等不斷研發擁有更強大算力的產品。而DeepSeek讓業內看到通過軟件架構及算法的革新,可能也是一條通往更高性能AI大模型的思路。
受此消息影響,美股周一納指開盤重挫逾3.5%,芯片股集體走低。截至周一收盤,英偉達、臺積電、博通、AMD、阿斯麥等均出現不同幅度的下跌,其中最受矚目的是英偉達暴跌16.97%,市值蒸發近5900億美元,相當于跌去了三個AMD的市值。
之后,英偉達發布聲明稱,“DeepSeek的研究成果展示了如何利用測試時計算擴展技術創建新模型,充分利用廣泛可用的模型和完全符合出口管制規定的算力。”言外之意,DeepSeek并未違反美國對于英偉達芯片的出口管制規定。
同時,英偉達還在聲明中表示,DeepSeek等AI公司的推理需要大量英偉達GPU(圖形處理器)和高性能網絡,DeepSeek的爆火表明市場對其芯片仍有需求。
據外媒報道,Meta成立了四個專門研究小組來研究國產大模型DeepSeek的工作原理,并基于此來改進旗下大模型Llama。其中兩個小組正在試圖了解幻方量化如何降低訓練和運行DeepSeek的成本。
需求爆火,DeepSeek被擠到宕機,創始人回應
隨著DeepSeek的火爆出圈,1月26日,該應用曾出現短時閃崩現象。
對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發需求。
1月27日晚,DeepSeek服務狀態頁面顯示,DeepSeek網頁不可用,公司正在調查這一問題。多位網友表示,DeepSeek無法回答對話問題。
1月28日凌晨,DeepSeek于服務狀態頁面公告稱,近期DeepSeek線上服務受到大規模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持。

日前,梁文鋒曾在接受媒體采訪時表示,中國AI不可能永遠處在跟隨的位置。“我們經常說中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。”
他認為,英偉達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手里有路線圖。中國AI的發展,同樣需要這樣的生態。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。