據(jù)媒體報道,月之暗面(Moonshot AI)正式推出其首款Agent產品——Kimi-Researcher(深度研究),并已啟動小范圍灰度測試。
該產品基于端到端自主強化學習(end-to-end agentic RL)技術打造,在HLE測試中表現(xiàn)優(yōu)異,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并與Gemini-Pro的Deep Research Agent持平。
Kimi-Researcher 是一款高度自主的智能研究助手,能夠獨立規(guī)劃任務流程并交付完整結果。與其他Agent不同,它采用零結構設計,無需復雜提示詞或預設流程,完全依靠自主決策能力在動態(tài)環(huán)境中運行。
例如,它能自行判斷信息沖突時的權衡策略、任務節(jié)點的切換時機,以及中間信息的取舍標準,其核心驅動力始終是任務的實際解決效果。
作為一款深度研究模型,Kimi-Researcher 整合了多源數(shù)據(jù),并支持每條引用的直接追溯,確保研究嚴謹性,有效減少幻覺問題。月之暗面表示,未來將逐步開源Kimi-Researcher 的基礎預訓練模型及強化學習優(yōu)化版本,以推動Agent強化學習領域的探索與發(fā)展。
