三大操作系統全面集成 AI進入人人皆可用時代快訊
操作系統能夠提供智能化的文件搜索功能,大模型的語言理解能力為操作系統的語音助手功能提供了強大的支持,以確保大模型和其他AI應用能夠順利地運行和升級。
TechWeb 文/卞海川
隨著AI技術的深度整合,操作系統地位抬升,價值將被重新定義。
大模型時代的操作系統正逐漸進化為一個更加智能的平臺,除了傳統的為應用程序提供運行環境和支持外,還將成為調度中心,作為“入口”銜接用戶和APP。
操作系統巨頭們的AI進化
以近日剛剛發布的Windows 11 AI PC的“回顧”(Recall)新功能為例,用戶能夠輕松找到此前在PC上瀏覽過的內容或是處理過的任務。Windows 11 AI PC能夠像人類一樣,基于個人經歷中的特有聯系和關聯整理信息。它能夠根據記憶中的線索碎片快速、直觀地檢索出用戶想要尋找的內容,幫用戶回想起那些幾乎已經遺忘了的事情。
此外,Windows 11 AI PC的另一大功能亮點是,具有實時翻譯功能的實時字幕。該功能可以將自動將任意App或視頻平臺上的直播或錄播音頻即時翻譯成英文字幕,支持包含中文在內的40多種語言翻譯,將PC所傳輸的音頻轉換為統一的英文字幕,并在App顯示窗口上實時顯示。即便用戶處于離線狀態,也能實現該功能。
值得注意的是,在常見的功能升級外,微軟在此次發布會上著重強調了AI PC與既有軟件深度協同上的優勢。
除了微軟外,谷歌宣布即將推出的Android 15將以AI為核心,Gemini將成為Android的基礎部分,可在系統層面運行。同時,谷歌還使用本地小模型Gemini Nano來保障用戶數據安全,端云AI 協同為用戶帶來更好的體驗。Gemini 將在Android上充當AI助手,而不是Google Assistant,Gemini AI將能夠作為任何正在使用的應用程序的疊加層出現。
其中,備受矚目的即圈即搜功能將不僅限于搜索物體,更增加了截圖與題目解答的智能化處理。用戶只需圈選題目,Android 15便能迅速提供解題思路與答案,助力學習。
又如在瀏覽PDF文件時,Android 15能夠總結文件內容,并以交互方式幫助用戶快速獲取所需信息。對于視頻內容,Android 15同樣具備強大的分析能力,能夠解析視頻內容與字幕,讓用戶更快捷地獲取關鍵信息。
此外,Android 15還引入了AI詐騙電話檢測功能,通過智能識別通話中的可疑行為,及時彈出警告提示,保護用戶免受詐騙侵擾。
至于蘋果,據多家外媒報道,蘋果有望與OpenAI合作,把一系列生成式AI 功能加入即將推出的iOS 18中。一個代號為“Project Greymatter”的AI工具套件或將集成到Safari、照片、語音備忘錄等蘋果的核心應用之中。
據稱,蘋果的重心是在iOS 18中加入ChatGPT支持的AI功能,并最終嵌入即將于今年9月發布的iPhone 16中。蘋果預計將在6月10日的WWDC大會上正式公布與OpenAI的合作伙伴關系,以及宣布其硬件設備上的大語言模型和云驅動的蘋果大語言模型。
AI技術對操作系統的影響
從上述三大操作系統巨頭與AI技術的深度融合來看,將大模型融入操作系統,不僅能夠為用戶帶來全新的功能和服務,還有助于推動操作系統向AI原生的方向發展。
例如在智能化的文件搜索上。通過大模型,操作系統能夠提供智能化的文件搜索功能。例如,用戶可以通過自然語言查詢,直接找到需要的文件或信息,大大提高了搜索的準確性和效率。
其次,大模型的語言理解能力為操作系統的語音助手功能提供了強大的支持。用戶可以通過語音指令,輕松完成系統設置、查詢信息等操作,實現了與系統的自然交互。此外,大模型的強大語言處理能力,使得操作系統可以提供實時翻譯功能。用戶可以得到及時、準確的語言翻譯服務,極大地方便了跨語言的交流和協作。
當然,要實現上述功能,需要操作系統能夠提供更為強大和靈活的支持,例如架構、運行環境、內存管理等的優化,以確保大模型能夠高效、穩定地運行,提高操作系統的整體性能。而隨著大模型的應用,AI框架的支持也會變得尤為重要,這就需要操作系統需要提供強大的AI框架支持,以確保大模型和其他AI應用能夠順利地運行和升級。
IDC中國研究經理程蔭對TechWeb表示,大模型、生成式AI將給操作系統的形態和業態帶來顛覆性變化?;谧匀徽Z言的極簡交互將替代很多傳統的圖形界面交互,形成LUI+GUI的混合形態。同時,“no app”的理念也將重塑下一代應用,通過對話即可直接調取、使用各種工具。由此,新一代的操作系統肯定會應運而生。操作方式被大幅簡化,應用之間的集成度更高,多應用之間也更加融合。價值如提高內容生產效率、個性化搜索和推薦、變革交互方式與體驗創新等等。
寫在最后
看未來,AI將是操作系統的基礎能力之一,通過大模型,開發者能夠為操作系統設計出智能搜索、推薦系統等,豐富操作系統的應用生態。同時,大模型通過自然語言處理和深度學習,可以使操作系統更好地理解用戶的需求和意圖,實時分析用戶上下文并預測需求,進而自主推斷并運行各種服務,無需用戶顯式指令,人機交互向更加自然、無感的境界邁進。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。