Moonshot AI發布首款自主強化學習Agent產品Kimi-Researcher,開啟灰度測試快訊
【TechWeb】Moonshot AI公司近日正式推出其首款Agent產品——Kimi-Researcher(深度研究),能夠獨立規劃任務流程并輸出完整的研究結果,Kimi-Researcher能夠自主判斷在信息沖突時的處理策略。
【TechWeb】Moonshot AI公司近日正式推出其首款Agent產品——Kimi-Researcher(深度研究),并且已經開始進行小范圍的灰度測試。

Kimi-Researcher采用端到端自主強化學習(end-to-end agentic RL)技術構建,在HLE測試中表現出色,其性能超過了Claude 4 Opus、Gemini 2.5 Pro以及OpenAI Deep Research等知名模型,與Gemini-Pro的Deep Research Agent性能相當。
這款智能研究助手Kimi-Researcher具有高度的自主性,能夠獨立規劃任務流程并輸出完整的研究結果。它與其他Agent的最大不同點在于其零結構設計,無需依賴復雜的提示詞或預設流程,完全依靠自主決策能力在動態環境中運作。
Kimi-Researcher能夠自主判斷在信息沖突時的處理策略,決定任務節點的轉換時機,以及篩選中間信息的重要性,始終以實際解決任務效果為核心驅動力。
作為一款專注于深度研究的模型,Kimi-Researcher整合了多個來源的數據,并支持每條引用的直接追溯,這保證了研究的嚴謹性,并有效降低了幻覺問題的出現。Moonshot AI表示,未來將逐步開放Kimi-Researcher的基礎預訓練模型及強化學習優化版本的源代碼,以促進Agent強化學習領域的進一步探索和發展。(Suky)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。