OpenAI發布新旗艦AI模型GPT-4o:同時具備文本、圖片、語音能力 免費提供快訊
導讀
OpenAI宣布推出其最新旗艦生成式AI模型GPT-4o,GPT-4o能在232毫秒內對音頻輸入做出反應,當然這并不意味OpenAI想讓我們和AI談戀愛。
【TechWeb】5月14日消息,OpenAI宣布推出其最新旗艦生成式AI模型GPT-4o,將免費提供給所有用戶使用,并且未來幾周內先向ChatGPT Plus用戶推送。

GPT-4o中的“o”代表“omni”(即全面、全能的意思)。據OpenAI介紹, GPT-4o是向更自然的人機交互邁出的一步:它接受文本、音頻和圖像的任意組合輸入,并生成文本、音頻和圖像的任意組合輸出。
GPT-4o能在232毫秒內對音頻輸入做出反應,平均反應時間為320毫秒,這與人類在對話中的反應時間相近。它在英語和代碼文本方面的性能與GPT-4 Turbo相當,在非英語語言文本方面也有顯著提高,同時在應用程序接口(API)方面速度更快,價格便宜50%。與現有模型相比,GPT-4o在視覺和音頻理解方面尤其出色。
這些功能早在預熱階段就被OpenAI CEO Altman 形容為“感覺像魔法”。
Altman在此前的采訪中表示希望最終開發出一種類似于科幻電影《她》中的AI助理。
2013年上映的科幻電影《她》講述了人類和AI談戀愛的故事。作家西奧多在結束了一段令他心碎的愛情長跑之后,愛上了一個叫做“薩曼莎”的AI姑娘。當然這并不意味OpenAI想讓我們和AI談戀愛。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。