研究顯示OpenAI新模型GPT-5能耗顯著高于前代快訊
這比 OpenAI 之前的 GPT-4o 模型消耗的能源要多得多,OpenAI 在周四發布了新一代模型 GPT-5,除了 OpenAI 今年 4 月發布的 o3 推理模型以及中國 AI 公司 Deepseek 的 R1 模型。
IT之家 8 月 10 日消息,2023 年中期,當用戶向 OpenAI 的 ChatGPT 詢問一道洋薊意大利面的食譜時,其回答所消耗的電量大約為 2 瓦時,相當于一個白熾燈泡兩分鐘的耗電量。OpenAI 在周四發布了新一代模型 GPT-5,專家指出,如果向 GPT-5 提出同樣的洋薊食譜問題,生成相同量的文本內容可能需要消耗數倍甚至 20 倍于此前的電量。
OpenAI 在推出 GPT-5 時,著重強調了該模型的突破性能力,例如能夠創建網站、回答博士級別的科學問題以及解決復雜問題。然而,長期致力于評估 AI 模型能源和資源使用情況的專家們指出,這些新功能的代價是 GPT-5 的回答可能比之前的 ChatGPT 版本消耗顯著更多的能量。
自 2020 年推出 GPT-3 以來,OpenAI 一直沒有公開其模型的功耗數據。該公司首席執行官山姆?奧爾特曼(Sam Altman)今年 6 月在其博客上發布了一些關于 ChatGPT 資源消耗的數字,但這些數據(每查次詢消耗 0.34 瓦時和 0.000085 加侖水)并未指代特定模型,也缺乏支持文件。
“像 GPT-5 這樣復雜的模型在訓練和推理過程中都會消耗更多電力。它還針對深度思考進行了優化…… 我可以肯定地說,它將比 GPT-4 消耗更多電力,”伊利諾伊大學教授拉凱什?庫馬爾(Rakesh Kumar)表示,他目前專注于計算和 AI 模型的能源消耗研究。
GPT-5 發布當天,羅德島大學 AI 實驗室的研究人員發現,該模型生成約 1000 個 token(AI 模型文本的基本單位,大致相當于單詞)的中等長度回答時,最多可能消耗 40 瓦時的電量。他們周五發布的儀表板顯示,GPT-5 的中等長度回答的平均能耗略高于 18 瓦時。這一數字高于他們評估的幾乎所有其他模型,除了 OpenAI 今年 4 月發布的 o3 推理模型以及中國 AI 公司 Deepseek 的 R1 模型。

“這比 OpenAI 之前的 GPT-4o 模型消耗的能源要多得多,”該研究小組成員尼達爾?杰格漢(Nidhal Jegham)表示。18 瓦時的能耗相當于讓一個白熾燈泡亮 18 分鐘,鑒于近期有報道稱 ChatGPT 每天處理約 25 億次請求,GPT-5 的總能耗可能達到 150 萬美國家庭的日用電需求。
盡管這些數字看起來很大,但該領域的研究人員表示,考慮到 GPT-5 據信比 OpenAI 之前的模型大數倍,其能耗水平符合他們的大致預期。自 GPT-3(擁有 1750 億個參數)以來,OpenAI 就沒有公布過任何模型的參數數量,而參數數量決定了模型的大小。
IT之家注意到,今年夏天法國 AI 公司 Mistral 的一項披露發現,在其對內部系統的研究中,模型大小與能源消耗之間存在“強相關性”。
“現在比以往任何時候都更迫切需要解決 AI 的真實環境成本,”羅德島大學教授馬爾萬?阿卜杜拉提(Marwan Abdelatti)表示。“我們呼吁 OpenAI 和其他開發者利用這一時刻,承諾全面透明,公開披露 GPT-5 的環境影響。”
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。