百度的陽謀,能成為AI原生應用的賣水人嗎?快訊
大模型最大的機會不在于模型本身而是應用,正如移動互聯(lián)網時代,微信、抖音、淘寶等應用帶來的商業(yè)機會,遠超ios或安卓等操作系統(tǒng)一樣。
大模型最大的機會不在于模型本身而是應用,正如移動互聯(lián)網時代,微信、抖音、淘寶等應用帶來的商業(yè)機會,遠超ios或安卓等操作系統(tǒng)一樣。
10月17日,百度世界大會2023在北京舉行。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏以《手把手教你做AI原生應用》為主題發(fā)表演講,帶來了打造AI原生應用的解法。
從數類原生應用的打造中,也顯露出百度在大模型時代下想要通過生態(tài)建立壁壘的雛形,圍繞大模型的搶灘應用之爭就此拉開帷幕。
兼容性應用占大頭
百度發(fā)布了兩大核心內容,文心一言4.0和AI原生應用;大模型的能力是打造AI原生應用的根基,4.0的大模型在此次發(fā)布會的篇幅更是讓位于AI原生應用。
今年7月,據IDC《AI大模型技術能力評估報告2023》顯示,文心大模型3.5共拿下12項指標的7個滿分,綜合評分位列國內主流大模型第一。
文心大模型4.0版本,整體效果又提升了近30%,訓練算法效率提升了3.6倍,周均訓練有效率98%,堪比GPT 4.0,但發(fā)布會上具體效果沒有直觀的對比。
在打造AI原生應用的過程中,百度始終遵循李彥宏提出的三個條件:
1、能用自然語言交互,這是最根本的變化;
2、能充分利用理解、生成、邏輯、記憶等;
3、每個應用的交互都不超過兩級菜單。
AI原生應用是基于大模型的“理解、生成、邏輯、記憶”能力開發(fā)出來的應用,是上個互聯(lián)網時代產品所不具備的。
1、理解:對前后亂序的表述,比較模糊的表達意圖,話語中的潛臺詞進行較準確的理解;
2、生成:可以基于理解的內容生成文字、圖片、視頻等多模態(tài)內容;
3、邏輯:在內容信息的基礎下,可以規(guī)劃、控制和感知的能力;
4、記憶:對于生成的內容有記憶,且可以區(qū)分避免前后矛盾的問題。
百度通過賦予單個應用智能操作到打造平臺聯(lián)合應用智能喚起實現AI原生應用的迭代,主要有以下三種形式:
1、單一的展示搜索功能向綜合性輸出轉變
百度搜索在AI重構下具備綜合信息和發(fā)和多輪交互三個特點,當用戶搜索問題時,新搜索將“不再是給你一堆鏈接”,通過對內容的理解,生成文字、圖片、動態(tài)圖表的多模態(tài)答案替代傳統(tǒng)鏈接的方式,讓用戶一步獲取答案。
在針對復雜需求時,“多輪交互”特點也可以通過提示、調整等方式,滿足用戶搜索需求。
在傳統(tǒng)學習辦公模式下,用戶往往需要經歷大量文檔查找、格式轉換、審校保存等繁瑣步驟。在AI重構下百度文庫基于10億優(yōu)質資料可以把這一文檔和收藏的資料相結合,生成PPT框架,美化作圖,最后生成一份完整的PPT,完成了從“內容工具”向“生產力工具”的進化。
百度網盤的AI重構是做好個人文件的智能服務。“重構后的網盤,不但實現了從圖形界面交互到自然語言交互的轉變,還增強了多模態(tài)信息理解。現在,只需要一句話,就能對自己網盤內的文件、圖片、視頻等進行操作。”李彥宏表示。
百度網盤搭配了智能助理云一朵,能理解視頻內容、識別角色、形成上下文記憶。并且,還能定位到視頻的某一幀,幫助用戶快速了解視頻內容。
百度搜索、百度文庫和百度網盤在應用功能上均屬于資料內容的展示與分類,在用戶使用時需根據自身需求進行定向的從查找到目標結果的提煉,在大模型的作用下,此類應用從單一的展示搜索功能向綜合性輸出轉變,通過以個人助理為主的媒介來實現需求和結果的承接。
2、短時間內有限信息的內容處理
百度GBI從三個方面顛覆了傳統(tǒng)的數據分析,也就是支持自然語言交互、跨數據庫分析和專業(yè)知識學習,是國內首個生成式商業(yè)智能(BI)。
傳統(tǒng)場景下需要通過專業(yè)人士跨數據庫、表格進行復雜操作來完成報告,李彥宏稱,百度GBI能將商業(yè)分析師十幾天才能完成的數據分析工作縮短到分鐘級。
百度如流能對會議進行實時記錄,一鍵生成會議紀要,為1000條信息1秒劃重點;可以幫助用戶解決瑣碎的事情,完成出差行程等安排,包括行程結束后航班時間的預約等。
會議記錄和行程安排等內容往往通過人力進行分布安排,特點是繁瑣且需要考量每一環(huán)節(jié)的合理性,會耗費大量精力。
百度GBI和百度如流以即時的信息為主,在信息內容的處理上并不復雜,主要在于涉及的操作環(huán)節(jié)較多,多考驗其在短時間內有限信息的處理上,往往以人力操作為主。
在上一代互聯(lián)網時,該類需求難以得到實現,在大模型下的作用下,其理解、生成、邏輯和記憶特性恰恰滿足了此類需求的要求,以處理短時間內有限信息為導向的需求將是AI原生應用的重要方向。
3、調動API接口,實現用戶決策閉環(huán)
百度地圖積累了導航、打車、找代駕、訂酒店等功能,過去這些操作很復雜,需要6、7步甚至20步才能完成,現在用戶只要說出需求,地圖就可以調動幾千個API服務接口,快速直達響應。
百度地圖可以實現通過某一個目標的規(guī)劃,在眾多能完成目標的應用進行選擇,通過大模型的邏輯推理能力,判斷在哪個應用中選擇,通過API接口實現應用功能代替在應用終端打開前的判斷過程。
如搜索附近評價高的餐廳,我們可以選擇的目標是打開生活類應用(如大眾點評,美團等)進行排名搜索,在地圖上搜索餐廳進行篩選查看或是通過社交媒體(如小紅書、微博等社交媒體)。
在我們決策前會通過個人偏好定向或依次打開相關的應用進行篩選對比,而大模型的能力則能在各應用間進行通用實現用戶決策前的最后一公里。
百度此次大會上在文心一言的能力展示上并未作太多篇幅,實際能力有待考究;AI原生應用上基于信息的數據分析及生成的應用展示是在情理之中,具備可復制的風險,更具想象力的原生應用沒有展示。
此次大會演講結尾,李彥宏表示“我們即將進入一個AI原生的時代,進入一個人機通過Prompt來交互的時代”,百度則是以身試法為我們展現了AI原生應用的迭代進程,將大模型的原生能力以合理的方式應用到實際情況。
布局原生資源,調用能力還待考量
百度在地圖上調用接口的方式正是打造AI原生應用的操作方式之一,在大模型的能力下,不再局限于單一應用的功能上,直接通過目標的下達,讓大模型在應用間進行決策,正是AI Agent(人工智能代理),通過獨立思考、調用工具去逐步完成給定目標。
在阿里云組織的“西溪論劍”上,創(chuàng)新工場創(chuàng)始人李開復提出,AI時代的Killer App(殺手級應用)可能有這樣的特征:完全的AI Native,放棄Compatibility(兼容性)。
做得最早的是MSN、QQ,但是勝出的是微信,因為張小龍做了一個決策,既然是移動互聯(lián)網的時代,就不要 PC 了,微信在早期專注在移動互聯(lián)網的特質上,百分百押注到新的技術平臺上。
從這個視角看,AI native(AI 原生)的應用可能有這樣的特征:如果大模型拿掉了,應用就崩潰了,它是一個完全依靠大模型能力的應用。但拿掉 Copilot,Office 軟件還是 Office,AI 只是錦上添花。
AI Agent與具身智能被認為是誕生Killer App最好的土壤。
與傳統(tǒng)人工智能不同,AI Agent能夠在沒有人類干預的情況下獨立運行。通過接入API,AI Agent甚至可以瀏覽網頁、使用應用程序、讀寫文件、完成信用卡付款等操作。
AI Agent只需設定目標,就能模擬智能行為,自動創(chuàng)建任務、確定任務列表優(yōu)先級、完成首要任務,并持續(xù)迭代,直至達成目標。簡而言之,只需要給它一個目標,AI Agent就能完成剩下的全部工作。
基于此,百度智能云構建了大模型超級工廠,這一工廠目前已經服務了超過17000家客戶,納管了42個國內外主流大模型,企業(yè)可以快速調用包括文心大模型在內的各種大模型的API,獲取大模型能力,千帆上直接調用大模型API的月活企業(yè)數近萬家。
在應用層面,此次百度智能云發(fā)布了“千帆AI原生應用開發(fā)工作臺”,能夠幫助企業(yè)敏捷、高效地進行AI原生應用開發(fā)的需求,降低AI原生應用開發(fā)門檻。
同時百度智能云發(fā)布了國內首個AI原生應用商店,幫助AI原生應用的供需雙方建立起聯(lián)接通路和交易平臺,大幅提升客戶應用選型與采購的效率。
百度通過大模型超級工廠鏈接了大模型商,在AI原生應用上提供開發(fā)門檻和商店,在此背景下百度成立平臺性舉措為其提供了API接口和AI原生應用資源。
為百度在實現基于AI Agent的目標,提供了潛在的調用接口,在百度這單一通道能實現應用的調用,調用能力也是考量AI Agent智能化的重要指標之一,為百度構建自家生態(tài)打造了壁壘。
百度在地圖上的嘗試,并未展示出在之后眾多API接口上的能力,在調用方式是通過已自家應用或是新的平臺型應用,對百度的調和能力是考驗,而在新的AI原生應用下,如何去合理的調用和適配是AI Agent下的難點。
具身智能指一種智能系統(tǒng)或機器能夠通過感知和交互與環(huán)境進行實時互動的能力,百度自然在該方向也有部署,首當其沖的是基于大模型下的自動駕駛應用,是視覺大模型在復雜場景下簡單操作的典型應用。
蘿卜快跑已經完成超過400萬次載客服務,在武漢、重慶、北京、上海等城市落地,未來隨著成本更低的自動化駕駛規(guī)模化部署等演進,其將越來越接近商業(yè)化。
百度智能駕駛事業(yè)群組(IDG)智能汽車業(yè)務部總經理蘇坦表示,“大模型時代,基于重構的思路,我們有機會把汽車座艙中人和機器的關系變成人和虛擬人的關系。基于文心大模型作為基礎模型,和百度Apollo在百萬量級智能汽車和不同場景的大量數據積累,進一步增強出了Apollo智艙大模型和智艙開發(fā)工具鏈。”
在智能家居方面百度推出了四款AI原生新產品:小度添添家庭機器人、小度青禾學習一體機和Tiantian Casa的兩款智能音箱,多以交互為主的固定式載體,主打情感陪伴、學習教導和輔助等功能。
在人形機器人上,百度自身沒有下場參與,但與市場上的硬件公司有著密切合作,最具代表的是百度參股了稚暉君(彭志輝)的智元機器人,其也發(fā)布了第一代產品“遠征AI”。
BV百度風投表示“我們看好智元通過融合大模型和機器人硬件技術,打造AGI通用人型機器人,以此來實現機器人的自主化和通用化。”
在AI原生應用的道路上,百度以自身優(yōu)勢的軟件為切入口,逐漸打造其百度生態(tài),通過平臺化鏈接API接口等原生資源,實現AI Agent乃至下一代“操作系統(tǒng)”的建立上,而百度野心的實現需要后續(xù)應用的接入,目前調和的能力有待考究。
落地初現成效,商業(yè)化仍是謎團
百度開啟了AI原生應用的鑰匙,圍繞大模型的商業(yè)化仍是謎團。
目前,大模型的B端應用已經出現四種商業(yè)模式,包括交易量收費、定制開發(fā)費用、服務費用和訂閱收費。
1、交易量收費:根據客戶每月使用的API調用或交易量收取費用。定價標準通常是按交易量計算,例如每千個API調用收取一定的費用;
2、定制開發(fā)費用:如果客戶需要特定領域的AI模型,公司通常會收取定制開發(fā)費用。定價標準通常取決于開發(fā)的難度和時間成本;
3、服務費用:根據提供數據處理、標注和質量控制服務等來收取費用;
4、訂閱費用:客戶可以根據需要選擇不同的訂閱級別,如基本、標準或高級。訂閱費用通常按月或按年收取,并根據所需服務的數量和類型進行定價。
在C端7月中旬出圈的秒鴨相機則是一款典型案例,妙鴨相機是一款基于AI人臉識別的相機應用,火爆的主要原因是妙鴨相機的AI寫真質量被認為和海馬體、天真藍等專業(yè)攝影機構不相上下,但是價格卻只要9.9元,通過較低的價格讓用戶擁有具有質量的體驗。
在AIGC時代,用戶免費、流量變現的商業(yè)模式,已經被大多數投資人和創(chuàng)業(yè)者拋棄,其先付費后使用邏輯的成功,也讓大模型應用在落地變現上有了參考,面對需求用戶的付費意愿是主動的,且具備潛在的市場空間。
百度在B端通過自身大模型和云業(yè)務的優(yōu)勢獲得增長,在C端仍以傳統(tǒng)廣告業(yè)務為主,在全面轉型大模型后,百度第二季度的營收和利潤雙雙實現增長。
財報顯示,第二季度,百度核心收入264億元,同比增長14%。百度核心經營利潤同比增長27%至65.1億元,經營利潤率為25%,相比2022年第二季度的22%和2023年第一季度的23%有所提升。
百度在線營銷收入為196億元,同比增長15%;非網絡營銷營收為68億元,同比增長12%。
除了實現營收和利潤大幅增長,百度智能云、智能駕駛、用戶產品等基本盤業(yè)務也在二季度持續(xù)高速增長。
作為經過AI調優(yōu)的云基礎設施,百度智能云為大模型訓練提供強大的算力,在第二季度,百度智能云簽約客戶數量持續(xù)增加,包括興業(yè)銀行、南網總調、漢得信息、金蝶、軟通動力等外部企業(yè)。
百度通過不斷迭代自身大模型的性能,保持位于前列的優(yōu)勢,通過切入AI原生應用,實現B端用戶的積累,一方面為其帶來收入方面的增加,另一方面打造其生態(tài)壁壘;在這過程中對百度云算力的要求也水漲船高,生態(tài)的建立需要依靠大量的前期資源投入,一旦無法跟上,將會流失客戶,目前的生態(tài)建立在先發(fā)優(yōu)勢上,生態(tài)的優(yōu)勢還未形成。
在C端產品中,百度通過打造AI原生應用的策略,實現產品力的提升,保持用戶的使用量,在大量的用戶基礎上通過傳統(tǒng)廣告等業(yè)務進行增收,在新推出的原生AI應用上,可采同樣的策略,或根據C端產品在市場的付費意愿及時調整,在新一輪功能的體驗上還未形成絕對性的優(yōu)勢,在邊界效益遞減的體驗下,百度產品的增長將放緩,其商業(yè)化的進程還需市場的檢驗。
1.TMT觀察網遵循行業(yè)規(guī)范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創(chuàng)文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創(chuàng)的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。