出門問問CEO李志飛評GPT-4o:讓人機交互這個渣男有望重新做人快訊
OpenAI也發(fā)布了一系列的應(yīng)用,我們覺得OpenAI發(fā)布應(yīng)用恰恰說明了應(yīng)用在人工智能領(lǐng)域大有可為,但最終能夠把大模型用好的還是應(yīng)用。
新浪科技訊 5月14日上午消息,對于OpenAI發(fā)布可實時進行音頻、視覺和文本推理的新一代AI模型GPT-4o一事,出門問問創(chuàng)始人兼CEO李志飛今日早間于“ “飛哥說AI”個人號發(fā)文表示:“人機交互這個渣男,因為GPT-4o的出現(xiàn),有望真的重新做人,開啟下一波的科技、應(yīng)用、和商業(yè)模式的革命,期待下一個十年。”
李志飛指出,自從2011年蘋果發(fā)布Siri,無數(shù)公司嘗試著做一個萬能的虛擬個人助理(VPA),包括Google,也包括出門問問,但基本都是demo炫酷,用戶用起來卻覺得很蠢。這次,OpenAI的demo無疑是把VPA推到了前所未有的高度。主要是以下幾點:
第一, 模型上端到端:以前的語音助手分下面多個步驟,喚醒、語音識別、自然語言理解、信息查詢、對話、TTS。每一個步驟是一個單獨的模型、由不同的專業(yè)團隊開發(fā)。GPT-4o是端到端模型,一個模型解決所有問題。
第二, 實時交互:因為是一個端到端模型,所以做到了平均300多毫秒的類似于人類的實時交互,如果用大模型串聯(lián)可能需要幾秒延遲。雖然以前的語音助手也可以實時交互,但大多是完成一些基本信息查詢(比如說附近的川菜館)和基本命令(比如說撥打電話號碼),但這個GPT-4o是一個真正意義上通用的VPA。
第三,多模態(tài)交互:以前的語音助手只是語音交互,而現(xiàn)在的GPT-4o是真正的多模態(tài),跟人類一樣,模態(tài)之間自由切換。牛X的是,GPT沒有因為加入別的模態(tài)而降低語言的理解和生成能力,大寫地服。
第四, 絲滑的交互體驗:從視頻來看,跟以前的語音助手不一樣,沒有反人類的喚醒、沒有答非所問的對話、沒有pipeline系統(tǒng)的錯誤傳遞,AI基本上可以作為一個聰明的人類參與人類的集體對話(AI參與多人視頻會議那個例子很好地證明了這個)。
第五,未來的期望:這次demo從體驗上很炸裂,讓我對大模型真正滲透到生活的方方面面重新產(chǎn)生了信心。除了打磨基本體驗外,未來可做的事情很多,比如說落地到各種智能硬件;跟智能家居、車載等各種場景結(jié)合實現(xiàn)跨場景聯(lián)動,感覺未來五年很多東西值得期待。
第六,前沿科技的timing: 這次的演示本身沒有新的idea,無論是現(xiàn)在的語音助手和多模態(tài)交互,還是未來要落地的智能硬件和多場景聯(lián)動,都沒有啥新的概念,過去十年很多人做過demo。但是過去的體驗都是半吊子,demo很酷、用起來反人類。本人做了十年,都已經(jīng)絕望了,直到大模型的出現(xiàn),才看到了一個全能的VPA的可能性。所以,前沿科技很多時候不在于vision,而在于實現(xiàn)vision的路徑和節(jié)奏。
李志飛外,對于GPT-4o的發(fā)布,獵豹移動董事長兼CEO、獵戶星空董事長傅盛今日早間同樣發(fā)文點評稱,“所有人工智能從業(yè)者都在熬夜等著大洋彼岸放核彈,但是沒想到核彈沒有放,掏出了一堆的摔炮。”
傅盛表示,這樣的評論雖然是一句玩笑話,但比較讓人失望的是這次OpenAI沒有發(fā)布GPT 5.0,連GPT4.5也沒有看到,反而是發(fā)布了GPT4o,就是把一系列的引擎給結(jié)合在一起,比如圖片、文字、聲音,這樣你就不需要來回去切換了。
當(dāng)然,傅盛也看到,OpenAI也發(fā)布了一系列的應(yīng)用,通過一個桌面的App讓你能夠方便地把圖片文檔上傳然后讓大模型去幫你分析;此外,最重要的是OpenAI還發(fā)布了一個語音助手,由于使用了端到端大模型技術(shù),所以這次語音助手的體驗超越了Siri,也遠超于我們以前用過的所有的各種AI助手,不僅能夠去感知情緒實時知道對話人的每一句話,并且在該插話的時候插話。
傅盛指出,一方面,我們覺得OpenAI發(fā)布應(yīng)用恰恰說明了應(yīng)用在人工智能領(lǐng)域大有可為,每一個創(chuàng)業(yè)者都應(yīng)該去好好的做人工智能應(yīng)用,大模型的能力當(dāng)然會不斷地迭代,但最終能夠把大模型用好的還是應(yīng)用,這次OpenAI的發(fā)布會,也說明了這一點。另一方面,如果不計成本的累參數(shù),提高所謂的大模型能力,這條路肯定是容易遇到困難的,目前看起來GPT5可能還要難產(chǎn)一段時間。
“OpenAI這次為了能夠讓更多的用戶使用它,可以說是卯足了勁,一系列的應(yīng)用,API降價,GPT免費,我們當(dāng)然希望OpenAI能夠使得這個行業(yè)更好的發(fā)展,我們也能認(rèn)真地去學(xué)習(xí),這次的發(fā)布會真正告訴我們應(yīng)用大有可為,所有人都應(yīng)該努力。”傅盛表示。(文猛)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。