快手、字節“AI軍備競賽”:一場沒有贏家的技術泡沫秀?觀點
2024年初,國產大模型行業受到OpenAISora AI視頻生成模型震撼。此后,快手、字節跳動等企業紛紛發力視頻大模型,但在技術成熟度與應用規范的打磨上仍需加強。
2024年初,OpenAI公布的Sora AI視頻生成模型,震撼了國產大模型行業。隨后國產廠商集體發力視頻大模型,快手發布視頻生成大模型可靈,字節跳動發布豆包視頻生成模型,正式打響了國內AI視頻生成領域第一槍。
眾多企業匆忙入局,只為在這片新興市場中搶占先機,卻往往忽視了技術成熟度與應用規范的打磨。
以社交平臺上泛濫的 AI 偽造視頻為例,全紅嬋家人被惡意仿冒博流量賣貨,明星們也紛紛中招,劉曉慶、張馨予等均曾反饋有人在視頻號上通過AI生成視頻假冒她。這些偽造視頻不僅嚴重侵犯他人權益,更在商業利益的驅使下,充斥著虛假營銷,讓不明真相的消費者屢屢受騙。
AI視頻生成領域正處于應用爆發前夜,快手、字節等業內玩家試圖通過技術迭代推動產品破圈,卻也陷入了無序競爭困境。
AI視頻賽道尚未成熟
當前,AI視頻生成賽道看似熱鬧非凡,實則整體仍處于不成熟的初級階段。
盡管各大廠商拼命投入資源,力求在模型性能指標上不斷突破,從生成時長的延長到畫面質量的優化,看似讓AI視頻生成賽道加速邁進“技術突破期”,但AI視頻技術應用仍有不完善之處。
以快手和字節跳動為例,快手于近期發布了可靈2.0視頻生成模型及可圖2.0圖像生成模型,自2024年6月6日首次上線開放測試以來,可靈AI已快速迭代二十余次,其模型在動態質量、語義響應、畫面美學等維度表現出色。
字節跳動的Seed團隊也推出了Seedream 3.0,據第三方榜單Artificial Analysis顯示,Seedream 3.0綜合性能追平文生圖SOTA模型GPT-4o,進入全球第一梯隊。
然而,這背后也暴露出AI視頻生成領域存在的諸多問題。
一方面,部分企業為了在競爭中脫穎而出,過度追求技術迭代速度,而忽視了產品應用的實際情況,使得AI視頻生成技術在實際應用中漏洞百出。
例如,當用戶輸入“敦煌飛天”時,AI可能生成面部扭曲的虛擬形象;要求制作科普視頻時,常出現違背物理規律的懸浮物體。據MIT媒體實驗室測試,當前主流AI視頻模型在復雜敘事連貫性上的準確率不足63%,這嚴重制約了AI視頻生成技術在商業應用中的邊界。
另一方面,隨著技術的快速發展,版權問題逐漸凸顯,成為AI視頻生成領域的一大“雷區”。
當AI融合多個版權素材生成新內容時,現有的“合理使用”原則已難以適用,這讓企業在版權問題上面臨著巨大的法律風險。從Getty Images起訴Stability AI使用其版權圖片訓練模型,到日本漫畫家協會禁止使用AI生成分鏡,再到全球首個AI視頻版權案判決金額高達2.3億美元,版權問題仍未得到合理解決。
更值得關注的是,當前的AI視頻生成技術雖然在畫面質量、生成速度等方面取得了顯著進步,但在視頻內容的邏輯連貫性、情感表達深度以及對復雜場景的理解等方面仍存在較大不足,無法完全滿足市場對高質量、多樣化視頻內容的需求。
由此可見,快手想要讓可靈AI成為營收規模全球第一的視頻生成AI應用,這條路任重道遠。
字節與快手“搶灘”
當前 AI 視頻生成領域風起云涌,字節跳動與快手作為行業內的兩大巨頭,正在 AI 視頻賽道上奮力搶灘,二者策略各有側重,呈現出別樣的競爭態勢。
快手主張商業化先行,打造多元變現模式,已在 AI 視頻生成領域取得了令人矚目的成績。
在技術方面,快手可靈 AI 展現出了強大的實力,為其商業化拓展提供了堅實的技術支撐。據全球知名 AI 基準測試機構 Artificial Analysis 發布的榜單顯示,快手可靈 1.6pro(高品質模式)以 1000 分的 Arena ELO 基準測試評分登陸圖生視頻賽道榜首,超越了 Google Veo 2、Pika Art 等強勁對手。
在商業化方面,快手無疑走在了前列。可靈 AI 采取了“C 端訂閱 + B 端 API 服務 + 定制化場景解決方案”的多元變現模式,既滿足了個人用戶的創意需求,又為企業客戶提供了強大的視頻生成工具。
據了解,可靈視頻大模型全球用戶規模突破 2200 萬,吸引了來自世界各地的超 1.5 萬開發者和企業客戶,將可靈的 API 應用于不同的行業場景中。截至 2025 年 2 月底,可靈 AI 的累計營業收入超 1 億元。
字節跳動則展現了不同的野心和策略,其對 AI 視頻生成的布局更側重于對 AGI(通用人工智能)的探索。
年初字節跳動豆包大模型團隊在內部組建了代號為“Seed Edge”的 AGI 長期研究團隊,鼓勵項目成員探索更長周期、不確定的和大膽的 AGI 研究課題,目標是探索 AGI 的新方法,并鼓勵跨模態、跨團隊合作。
字節跳動近期發布的 Seaweed-7B 模型,以其音畫一體生成、長鏡頭生成、實時生成等多項前沿技術。該模型能夠在短短 25 秒內生成高質量的視頻內容,且推理速度比同類模型提升 62 倍,其性能與 Wan 2.1-14B 相當,在文本轉視頻的任務中,Elo 評分僅次于排名第一的模型 Veo 2。
相比于快手的商業化先行,字節跳動更注重在技術層面的深耕和突破,試圖通過解決 AGI 這一終極難題,來實現其在 AI 視頻生成領域的長遠發展和全面領先。快手需要在保持商業化優勢的基礎上,進一步加大技術研發投入,提升 AI 視頻生成的質量和效率,以免被字節跳動搶了“風頭”。
更大的目標和挑戰
AI浪潮洶涌,快手正試圖借助 AI 之力重塑自身商業版圖,AI視頻生成賽道只是其宏偉藍圖中的一部分。
從快手的營收數據來看,2024 年總營收同比增長 11.8% 至 1269 億元,經調整凈利潤大幅增長 72.5% 達 177 億元,線上營銷服務和其他服務收入同比增長率均超 20%,亮眼的成績背后,AI 成為了關鍵的增長引擎。
快手設定的AI目標很宏大,其面臨的挑戰也全方位且極為嚴峻。
一方面,快手計劃持續強化 AI 技術對原有商業生態的改造,為線上營銷服務和電商業務開拓新的增長空間。
理論上 AI 可以精準分析用戶需求,為商家提供更有效的營銷方案,但實際操作中卻困難重重。在內容生產環節,AI 更多只能起到輔助作用,無法從根本上解決內容質量參差不齊的問題;在經營成本方面,AI 技術的引入可能會在一定程度上降低某些環節的成本,但同時也帶來了新的成本,如技術使用成本、數據安全維護成本等。
另一方面,快手全力升級以可靈為代表的 AI 商業化變現模式,試圖將可靈 AI 打造成為全球 1200 億美元視頻創作市場的 AI 基礎設施,進而實現從“中國第二大短視頻平臺”到“AI 視頻生態領軍者”的華麗轉身。
這無疑是一場豪賭。構建基礎設施意味著要具備強大的技術通用性、穩定性以及廣泛的市場認可度,快手需要投入海量的資源用于技術研發、生態建設與市場推廣。而當前行業內,技術標準尚未統一,市場格局分散,快手在推動自身技術成為行業標準的過程中,必然會遭遇來自各方的阻力。
機遇與挑戰并存,如果快手不能在技術研發、商業策略以及行業責任擔當等方面做出深刻調整與優化,那么其所謂的“AI 視頻生態領軍者”的愿景,很可能只是鏡花水月,最終在激烈的市場競爭與行業變革中被無情淘汰。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。