Kimi-Researcher首秀:這一波“深度研究”,打出了王者歸來的氣勢
最近有個問題,一直在困擾著我:為什么杭州和北京的AI公司那么多,而其他地方的相對就更少呢?
正好當時我申請內(nèi)測的Agent通過了,于是我就用它跑了一個深度研究的任務,然后就電腦就掛在那,干別的事情去了。
當我再次點開它的界面之后,任務已經(jīng)完成了,還為我生成了一份可視化的報告:
這是那份報告的頭圖。
講真的,看到這張圖片的那一刻,我腦中浮現(xiàn)了兩個字——
“精彩”。
一、Kimi的榮耀與滑鐵盧
如果你問我,國產(chǎn)AI這么多,哪一款讓我最覺得可惜,我會告訴你,是Kimi。
在早期,這個AI是我使用的最多,也認為是最好用的。
無他,因為它的長文本處理能力,在2024年的國產(chǎn)大模型中,堪稱頂流。
2023年10月,Kimi AI首次亮相,它主打的20萬字上下文長度在當時已經(jīng)是一個足夠驚艷的數(shù)字。之后的幾個月里,Kimi AI 的月活躍用戶(MAU)持續(xù)增長,從50萬到298萬,從2023年12月到2024年2月,只用了3個月時間。
而它背后的公司——月之暗面,也開始走入人們的視野。
2024年3月,月之暗面宣布Kimi支持200萬字的無損上下文輸入,引起了一波轟動,在5個月時間內(nèi),上下文長度提升10倍,同時也引起了同行在長文本領域的“內(nèi)卷”,各大互聯(lián)網(wǎng)廠商紛紛跟進,開啟了“軍備競賽”式的競爭,Kimi也及時在B站投流,實現(xiàn)了用戶的快速增長。
之后的幾個月里,Kimi的月活躍用戶持續(xù)攀升,到2024年11月,據(jù)創(chuàng)始人楊植麟所說,已經(jīng)達到了3600萬。
按理說,如此猛的勢頭,Kimi應該繼續(xù)牛逼下去,直到“封神”。
可是,在2025年,Kimi卻遭遇了它最為強力的競爭對手。
2025年初,DeepSeek(深度求索)橫空出世,憑借開源+強大的技術實力,直接打擊了包括Kimi在內(nèi)的一眾競品。
2025年3月,DeepSeek月活躍用戶數(shù)達到1.94億,位居AI原生APP榜首,而Kimi的月活躍用戶則是從頂峰時期的3600萬下滑到了1830萬,位居第四。
在國內(nèi)AI用戶甚至是普通民眾的口中,“DeepSeek”成為了大家口中頻繁出現(xiàn)的詞匯,AI頂流的代名詞,直到今天。
而Kimi呢?
仿佛它的高光時刻,已經(jīng)過去,淪為了眾多新興AI的墊腳石。
我個人就有很深的體會,說實話,我已經(jīng)很久沒有點開Kimi的網(wǎng)頁或者APP了。
去年3月,Kimi風光無限,今年3月,Kimi卻沒能夠再次震撼世界。
然而,在AI圈大戰(zhàn)沒落下帷幕的時候,乾坤未定,一切皆有可能。
6月20號,月之暗面官方發(fā)布的一篇文章,讓我忍不住感嘆:原來不是Kimi握不動刀了,而是它拿起了板磚!
二、Kimi-Researcher,專為深度研究而生的Agent
1、你是否也有同感?
GDR(Google DeepResearch)一直是我很喜歡用的一個產(chǎn)品,動輒輸出十多頁、二十多頁的報告,總讓我有種莫名的“量大管飽”的滿足感…
- 不過,如果要說它有什么地方有待改進的話,作為資深用戶,我還是能提幾個出來的:對網(wǎng)絡環(huán)境要求極高…大家都知道,由于Gemini是國外的AI,所以如果要使用它的話,不得不用些特殊手段,這點就在無形當中制造了門檻;
- 當你發(fā)出指令的時候,它會先列出執(zhí)行步驟給你確認,但是假如我們自己都沒想清楚,那自然也沒有辦法進行修正,這種感覺,就像點外賣的時候沒選擇“需要餐具”一樣尷尬…
- 它開始干活的時候,真的是很嚴格地在按照流程來執(zhí)行,但是有時候太“按規(guī)矩辦事”,反而失去了一些靈動感,畢竟…哪位老板希望自己的員工只像老黃牛一樣吭哧吭哧地埋頭苦干呢…
但是這絲毫不影響我對Gemini的愛,充其量只是相當于,喜歡的女孩臉上長了青春痘,雖然影響了美貌,但是無傷大雅…
不過總是有些遺憾。
2、Kimi-Researcher,來了。
上周五,朋友群里轉發(fā)了一篇來自Kimi官方的公眾號文章,就講了一件事——他們發(fā)布了一款專門為了深度研究而生的Agent,并且現(xiàn)在開始了內(nèi)測。
這一下,好像平靜的水面投入了一顆巨石,激起千層浪…群炸了。
我也在第一時間就申請了內(nèi)測。
我也忘了是多久,反正就不超過一天的時間,當我再次點進Kimi官網(wǎng)的時候,輸入框下面就出現(xiàn)了一個“深度研究”的按鈕。
最近AI的活動賊多,群里幾乎每天都能收到“某某AI舉辦活動,地址在北京/杭州”這樣的消息。
每次有朋友說自己要去的時候,我內(nèi)心都涌現(xiàn)出一堆很復雜的情緒,總結兩個字:“羨慕”。
所以,我稍加思索之后,就輸入了這段話:
引用可靠來源,經(jīng)過多角度,多維度的分析,告訴我以下答案:
為什么AI公司基本都開在北京和杭州?
Kimi給我的回復是這樣的:
我們可以看到,它不是著急干活,而是要先向我確認我的具體需求。
這一步驟,叫做“澄清問題”。是當它理解問題時,主動反問,向用戶做確認,有的放矢。
其實我很怕麻煩,如果可以,我真想要的是當一名“甩手掌柜”,完全不插手,不參與。
但是這明顯不太可能。
因為一旦我真的當了甩手掌柜,那么結果就完全不是我可以控制的,甚至可能輸出一份與我的要求不符合的報告,不僅白白浪費時間,還給自己找罪受….
但是如果你要我說出個一二三來,準確表達我的需求,這又有點為難我了。
Kimi-Researcher直接像一名稱職的助理一樣,直接列出需要關注的點,讓我自己選擇,有了這一步操作,起碼能夠保證這份報告具有一定的聚焦。
然后,我就告訴它:
其實這一步我是感覺有些驚訝的。
因為我自己都沒注意到,我提出的“AI公司”這個概念太龐大了,但是Kimi注意到了,并且還向我發(fā)起了提問。
那在之后的時間里,我原本應該去干自己的事兒,坐等報告就好,但是奈何Kimi Research執(zhí)行任務的過程太精彩了,比小說還好看,一下子就吸引了我的眼球。
直到這里,我才想起,Kimi-Research,它就是一個Agent?。?/p>
Kimi-Research并沒有選擇一條道走到黑——只關注在這些特定問題上不懂變通,而是學會了自己思考。
這個部分,是它的深入思考:能夠自主梳理并理解需求,在這當中,我們只需要幫助它錨定需要聚焦的點就可以,其他的讓其自由發(fā)揮。
我們同樣,也能看到,它其實是有在提取關鍵詞,根據(jù)關鍵詞進行搜索的,而且它能夠篩選,把那些信息質(zhì)量高的來源主動摘取出來,作為報告的引用源。
而這,是它任務步驟中的“主動搜索”。
它在不需要人工干預的情況下,經(jīng)過推理之后自行采取更加合理的策略,使用更加高質(zhì)量的搜索來源。
在經(jīng)過不算太漫長的等待,大約5分鐘左右之后,這份由我+Kimi-Research共同撰寫的研究報告就完成了。
在這過程中,它出現(xiàn)了明顯的自主性,調(diào)用合適的工具完成任務,交付結果。
隨之輸出的,不僅是一份文字報告,還有一份網(wǎng)頁的可視化報告。
仔細看這份文字報告,它不止有文字,它還在每個引用的地方標注了參考來源。當我們點擊文字旁邊的方塊后,在右側會跳轉到對應的引用內(nèi)容,并且對于它引用的部分,還進行了高亮處理。
點進它引用的文章,跳轉頁面,我們又能看到一個細節(jié):
它從哪段開始引用的,在來源的網(wǎng)頁里,也給你標出來了。
仿佛真的是一名嚴謹專業(yè)的研究員。
而且….
我寫論文的時候,也沒有這么嚴謹好吧。
真正的做到了“可溯源”,確保了信息來源的可靠性。
在以前,為了防止AI隨意杜撰,捏造一些不存在的網(wǎng)頁,我都會在提示詞上加一段:“引用可靠的來源,不要隨意杜撰”。
但是現(xiàn)在,完全不需要了。
因為Kimi會自己幫助你驗證這些網(wǎng)站的可靠性,這就是它“懂我們沒說的”。
完整的文字報告太長了,我就不放了,大家可以在評論區(qū)回復,我會私發(fā)給你。
可視化報告如下:
網(wǎng)頁鏈接:https://www.kimi.com/preview/d1e1ln9sfuve986n5brg?blockId=18
在這個網(wǎng)頁里,我們能看到,它的左邊是有目錄的,點擊就能夠跳轉到對應章節(jié)。而且對于有需要的地方,它能夠幫你繪制表格,形狀,而且樣式還特別精美,保證你看了之后不會想打瞌睡。
只因你…你的報告,你做主。
考慮到大家的觀感…請點擊上面的網(wǎng)頁移步觀看,記得回來,因為精彩的內(nèi)容,才剛剛開始。
三、案例測試
之后,我又跑了好幾個案例,我將它的問題澄清部分和我的回復都放在下面,是不是夠強大,有沒有嚴格遵循我的指令,交給朋友們來評判,如果你要文字版本,歡迎在評論區(qū)留言:
1、提示詞的輸入對AI輸出結果的決定作用
提示詞:提示詞的輸入對于AI的輸出結果起到怎么樣的作用?請參考可靠的信息來源,從多方查證后,為我輸出一份深度研究的報告。
Kimi確認需求:
我的回復:
生成的可視化網(wǎng)頁:https://www.kimi.com/preview/d1e2pvope77i9aeu4itg?blockId=52
2、那藝娜為什么還能這么火?
提示詞:
那藝娜明明被拆穿了俄羅斯人的身份,為什么現(xiàn)在還那么火?
Kimi確認需求:
我的回復:
生成的可視化網(wǎng)頁:https://www.kimi.com/preview/d1e2ujo52cekgv1uhep0?blockId=18
3、Kimi從發(fā)布到今天的月活用戶變化
提示詞:
Kimi AI發(fā)展情況是怎么樣的?它的月活用戶量變動情況如何?未來它有可能怎么樣發(fā)展?請從Kimi的發(fā)布時間開始算起,直到今天2025年6月24日,參考可靠來源, 從多視角、多維度進行深度研究,為我生成報告。
Kimi確認需求:
我的回復:
生成的可視化網(wǎng)頁:https://www.kimi.com/preview/d1e36njlmiuf20s294n0?blockId=38
在這當中,Kimi-Research出現(xiàn)了一個很有意思的行為:它在沒有任何干預的情況下,察覺到了代碼存在問題,所以果斷放棄了代碼,選擇了直接撰寫報告。
具體為什么會這樣?
所謂“知其然知其所以然”,在研讀了月之暗面發(fā)布的技術解析博客后,我想試試看,用大家能聽得懂的語言,來為大家講解,在發(fā)起任務到完成交付的過程中,Kimi的這個Agent,用了怎么樣的技術,如果有不完全的地方,請大家見諒哈~
四、技術原理解析
1、端到端自主強化學習
首先,我們應該知道,什么是“端到端”,指的是“用戶輸入”到“交付結果”中間,沒有任何的人工干預,也不出現(xiàn)既定的套路模板,而是由Agent自行完成。Open AI的深度研究也采用了這樣的方式。
其次,“自主強化學習”,指的是模型能夠自動調(diào)用相關的工具,并且根據(jù)任務的進度能夠自行判斷哪個工具最為合適,不依賴我們的提示詞,自己就能夠走完全程。
2、獎勵機制
這是強化學習中很重要的一個概念。它能夠幫助模型分辨“好”與“不好”。
為什么會這樣?
在一開始的時候,就由人工進行標注,讓人類為模型的回答打分。
例如,面對“今晚去哪里吃飯”這個問題,模型給出的回答是“去找家餐廳吧”,對這個回答給予高分;而對“去廁所”這個回答給予低分,這樣就得到了原始的標注好的數(shù)據(jù)。
再根據(jù)標注好的數(shù)據(jù),來訓練一名“打分員”(獎勵模型),讓模型自己來判斷好與不好。每次生成回答后,“打分員”會對回答進行打分,模型再根據(jù)回答調(diào)整自己的解題思路(參數(shù)),這個過程中,模型的回答會越來越偏向于人類滿意的回答,這個過程就叫“強化學習”。
而在Kimi-Researcher中,使用的獎勵機制是兩種:
- 格式獎勵:每當模型的操作不符合“操作手冊”的規(guī)范,它就會被扣錢(獲得負獎勵),從而幫助它的操作具有規(guī)范性和有效性,變成一名聽話的好員工。
- 正確性獎勵:基于格式獎勵,對于模型符合操作規(guī)范的情況,將它最終輸出的答案與標準答案進行比較,這就促使它的每一步都是為了產(chǎn)生更好的。
然而,對于操作流程完全正確,答案符合標準的兩條答復,路徑較短、更高效的回答,會在一開始就能夠得到獎勵,從而幫助模型能夠更加有效率的完成任務。
3、上下文管理
對于更復雜、流程更繁瑣的任務,模型引入了上下文管理的方法,它就像聰明的學生,并不是每條消息都去記,而是會選擇更重要的,丟棄不必要的,從而有選擇性地去記憶,這樣就能獲取更多信息,實現(xiàn)更高的性能。
4、并行工具調(diào)用
為了完成任務,Kimi-Researcher攜帶了三樣工具。
- 并行的實時內(nèi)部搜索工具:可以同時發(fā)起多個請求,縮短信息檢索的時間,從而更高效地找到答案,如果任務需要大量背景信息、專業(yè)知識,或者是某些特定的數(shù)據(jù),這個工具是很關鍵的。
- 用于交互式網(wǎng)頁任務,基于文本的瀏覽器工具:它會模擬人類在網(wǎng)頁上的操作,例如點擊鏈接、提取特定區(qū)域的內(nèi)容,使得模型能夠在一些交互式的網(wǎng)頁中提取數(shù)據(jù)。
- 用于自動執(zhí)行代碼的編碼工具:還記得剛剛截圖里我們看到的使用python編碼的操作嗎?它就是來自于這個編碼工具,它賦予了模型計算能力和數(shù)據(jù)處理能力,可以運行python代碼,對于收集到的數(shù)據(jù)進行分析和處理。
而這三個工具,都被放置在端到端的自主強化學習框架下,供模型自己選擇什么時候用什么工具,能夠更好完成任務。
五、怎么樣才能用上?
目前,Kimi官網(wǎng)已經(jīng)開放了對Kimi-Research的內(nèi)測申請。
電腦進入Kimi官方網(wǎng)站:https://www.kimi.com/
在輸入框下方,點擊“申請Kimi Research內(nèi)測”:
現(xiàn)在通過的時間應該蠻快的,不會超過半天,你填寫的手機號會收到一條短信,告訴你申請通過。
再次進入官網(wǎng),你會發(fā)現(xiàn),輸入框里多了一個按鈕:
這就說明你已經(jīng)可以用Kimi-Research,為你完成任務了。
需要注意的是,每個月20次使用額度,別一不小心就用完了~
Kimi-Research雖好,可別貪用哦~
誰需要Kimi-Research?
如果你是一名學生,你可以用它來幫你搞懂復雜難懂的概念,讓Kimi來當你的老師,陪伴你在學習道路上過五關斬六將;
如果你是數(shù)據(jù)分析從業(yè)者,那就更好辦了——Kimi會幫你自動篩除掉那些無用的、低質(zhì)量的信源,采用高質(zhì)量的、有效的,對你需要整合的數(shù)據(jù)進行深入分析;
如果你是一名學術研究人員,或者正在撰寫學術論文,你可以讓Kimi來幫你查找可靠的資料,省去你辛苦跑知網(wǎng)、維普、萬方,查找、閱讀論文的時間;
如果你是酷愛沖浪的選手,你也可以用Kimi,輕松得知一個梗的前世今生,就像我用它來分析為什么那藝娜會那么火的原因一樣,讓你輕松踩在浪潮前端,打破信息差,不掉隊。
….
更多好玩的場景,等你來發(fā)現(xiàn)。
六、Kimi,尚能飯否?
在以上的內(nèi)容中,我們一起跑了幾個任務,但是我心中仍舊有所懷疑,那就是:它和傳統(tǒng)意義上的深度研究,區(qū)別在哪?官方說它是一個Agent,真的做到了嗎?
于是,我把這個問題扔給了ChatGPT。
它對于Agent的定義,有點意思。
ChatGPT認為,合格的Agent應該做到五個方面,將單詞“Agent”拆分開來:
??
A-G-E-N-T
Awareness(有感知):能識別用戶意圖,哪怕用戶沒說,它也能做得好。能理解上下文,也能看懂網(wǎng)頁,讀懂文檔。
Goal-oriented(有目標):并不是像無頭蒼蠅一樣到處亂轉,而是有著清晰的結果導向,并且為了達到目標,而調(diào)用自身一切的資源。
Execution(能行動):能操作工具,完成任務。
Navigation(能規(guī)劃路徑):不只是將大目標拆分為子任務,而是有規(guī)劃的去執(zhí)行,不墨守成規(guī)。
Tuning(能自我調(diào)整):面對查詢到的數(shù)據(jù)有沖突,策略有錯誤的時候,它不鉆牛角尖,而是自己做決定,選擇更好的方案。
那從這一點看來,Kimi發(fā)布的首個Agent,確實成了。
為什么Kimi的第一個Agent,要做Researcher,這個看似好像沒有必要再繼續(xù)擴展的賽道?
官方的一句話,讓我淚目:
并且,在不久的將來,Kimi-Researcher 的基礎預訓練模型以及其背后的強化學習模型,會被開源出來,讓我們每個人都實現(xiàn)“研究自由”。
Kimi,尚能飯否?
答案是:能!并且肯定會繼續(xù)變好。
讓我們期待,Kimi重現(xiàn)輝煌的那一天。
感謝你的觀看,如果你覺得這篇文章有幫到你,是我的榮幸~
歡迎點贊、推薦、轉發(fā)給你那還在為了論文、為了報告而焦頭爛額的朋友。
如果你也用Kimi-Researcher整了更好玩的活,歡迎在評論區(qū)分享~
本文由 @ Simonlin(公眾號同名)原創(chuàng)投稿或授權發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載
題圖來自 Unsplash,基于CC0協(xié)議,該文觀點僅代表作者本人。
- 目前還沒評論,等你發(fā)揮!