Kimi-Researcher首秀:這一波“深度研究”,打出了王者歸來的氣勢

0 評論 1963 瀏覽 0 收藏 25 分鐘

最近有個問題,一直在困擾著我:為什么杭州和北京的AI公司那么多,而其他地方的相對就更少呢?

正好當時我申請內(nèi)測的Agent通過了,于是我就用它跑了一個深度研究的任務,然后就電腦就掛在那,干別的事情去了。

當我再次點開它的界面之后,任務已經(jīng)完成了,還為我生成了一份可視化的報告:

這是那份報告的頭圖。

講真的,看到這張圖片的那一刻,我腦中浮現(xiàn)了兩個字——

“精彩”。

一、Kimi的榮耀與滑鐵盧

如果你問我,國產(chǎn)AI這么多,哪一款讓我最覺得可惜,我會告訴你,是Kimi。

在早期,這個AI是我使用的最多,也認為是最好用的。

無他,因為它的長文本處理能力,在2024年的國產(chǎn)大模型中,堪稱頂流。

2023年10月,Kimi AI首次亮相,它主打的20萬字上下文長度在當時已經(jīng)是一個足夠驚艷的數(shù)字。之后的幾個月里,Kimi AI 的月活躍用戶(MAU)持續(xù)增長,從50萬到298萬,從2023年12月到2024年2月,只用了3個月時間。

而它背后的公司——月之暗面,也開始走入人們的視野。

2024年3月,月之暗面宣布Kimi支持200萬字的無損上下文輸入,引起了一波轟動,在5個月時間內(nèi),上下文長度提升10倍,同時也引起了同行在長文本領域的“內(nèi)卷”,各大互聯(lián)網(wǎng)廠商紛紛跟進,開啟了“軍備競賽”式的競爭,Kimi也及時在B站投流,實現(xiàn)了用戶的快速增長。

之后的幾個月里,Kimi的月活躍用戶持續(xù)攀升,到2024年11月,據(jù)創(chuàng)始人楊植麟所說,已經(jīng)達到了3600萬。

按理說,如此猛的勢頭,Kimi應該繼續(xù)牛逼下去,直到“封神”。

可是,在2025年,Kimi卻遭遇了它最為強力的競爭對手。

2025年初,DeepSeek(深度求索)橫空出世,憑借開源+強大的技術實力,直接打擊了包括Kimi在內(nèi)的一眾競品。

2025年3月,DeepSeek月活躍用戶數(shù)達到1.94億,位居AI原生APP榜首,而Kimi的月活躍用戶則是從頂峰時期的3600萬下滑到了1830萬,位居第四。

在國內(nèi)AI用戶甚至是普通民眾的口中,“DeepSeek”成為了大家口中頻繁出現(xiàn)的詞匯,AI頂流的代名詞,直到今天。

而Kimi呢?

仿佛它的高光時刻,已經(jīng)過去,淪為了眾多新興AI的墊腳石。

我個人就有很深的體會,說實話,我已經(jīng)很久沒有點開Kimi的網(wǎng)頁或者APP了。

去年3月,Kimi風光無限,今年3月,Kimi卻沒能夠再次震撼世界。

然而,在AI圈大戰(zhàn)沒落下帷幕的時候,乾坤未定,一切皆有可能。

6月20號,月之暗面官方發(fā)布的一篇文章,讓我忍不住感嘆:原來不是Kimi握不動刀了,而是它拿起了板磚!

二、Kimi-Researcher,專為深度研究而生的Agent

1、你是否也有同感?

GDR(Google DeepResearch)一直是我很喜歡用的一個產(chǎn)品,動輒輸出十多頁、二十多頁的報告,總讓我有種莫名的“量大管飽”的滿足感…

  • 不過,如果要說它有什么地方有待改進的話,作為資深用戶,我還是能提幾個出來的:對網(wǎng)絡環(huán)境要求極高…大家都知道,由于Gemini是國外的AI,所以如果要使用它的話,不得不用些特殊手段,這點就在無形當中制造了門檻;
  • 當你發(fā)出指令的時候,它會先列出執(zhí)行步驟給你確認,但是假如我們自己都沒想清楚,那自然也沒有辦法進行修正,這種感覺,就像點外賣的時候沒選擇“需要餐具”一樣尷尬…
  • 它開始干活的時候,真的是很嚴格地在按照流程來執(zhí)行,但是有時候太“按規(guī)矩辦事”,反而失去了一些靈動感,畢竟…哪位老板希望自己的員工只像老黃牛一樣吭哧吭哧地埋頭苦干呢…

但是這絲毫不影響我對Gemini的愛,充其量只是相當于,喜歡的女孩臉上長了青春痘,雖然影響了美貌,但是無傷大雅…

不過總是有些遺憾。

2、Kimi-Researcher,來了。

上周五,朋友群里轉發(fā)了一篇來自Kimi官方的公眾號文章,就講了一件事——他們發(fā)布了一款專門為了深度研究而生的Agent,并且現(xiàn)在開始了內(nèi)測。

這一下,好像平靜的水面投入了一顆巨石,激起千層浪…群炸了。

我也在第一時間就申請了內(nèi)測。

我也忘了是多久,反正就不超過一天的時間,當我再次點進Kimi官網(wǎng)的時候,輸入框下面就出現(xiàn)了一個“深度研究”的按鈕。

最近AI的活動賊多,群里幾乎每天都能收到“某某AI舉辦活動,地址在北京/杭州”這樣的消息。

每次有朋友說自己要去的時候,我內(nèi)心都涌現(xiàn)出一堆很復雜的情緒,總結兩個字:“羨慕”。

所以,我稍加思索之后,就輸入了這段話:

引用可靠來源,經(jīng)過多角度,多維度的分析,告訴我以下答案:

為什么AI公司基本都開在北京和杭州?

Kimi給我的回復是這樣的:

我們可以看到,它不是著急干活,而是要先向我確認我的具體需求。

這一步驟,叫做“澄清問題”。是當它理解問題時,主動反問,向用戶做確認,有的放矢。

其實我很怕麻煩,如果可以,我真想要的是當一名“甩手掌柜”,完全不插手,不參與。

但是這明顯不太可能。

因為一旦我真的當了甩手掌柜,那么結果就完全不是我可以控制的,甚至可能輸出一份與我的要求不符合的報告,不僅白白浪費時間,還給自己找罪受….

但是如果你要我說出個一二三來,準確表達我的需求,這又有點為難我了。

Kimi-Researcher直接像一名稱職的助理一樣,直接列出需要關注的點,讓我自己選擇,有了這一步操作,起碼能夠保證這份報告具有一定的聚焦。

然后,我就告訴它:

其實這一步我是感覺有些驚訝的。

因為我自己都沒注意到,我提出的“AI公司”這個概念太龐大了,但是Kimi注意到了,并且還向我發(fā)起了提問。

那在之后的時間里,我原本應該去干自己的事兒,坐等報告就好,但是奈何Kimi Research執(zhí)行任務的過程太精彩了,比小說還好看,一下子就吸引了我的眼球。

直到這里,我才想起,Kimi-Research,它就是一個Agent?。?/p>

Kimi-Research并沒有選擇一條道走到黑——只關注在這些特定問題上不懂變通,而是學會了自己思考。

這個部分,是它的深入思考:能夠自主梳理并理解需求,在這當中,我們只需要幫助它錨定需要聚焦的點就可以,其他的讓其自由發(fā)揮。

我們同樣,也能看到,它其實是有在提取關鍵詞,根據(jù)關鍵詞進行搜索的,而且它能夠篩選,把那些信息質(zhì)量高的來源主動摘取出來,作為報告的引用源。

而這,是它任務步驟中的“主動搜索”。

它在不需要人工干預的情況下,經(jīng)過推理之后自行采取更加合理的策略,使用更加高質(zhì)量的搜索來源。

在經(jīng)過不算太漫長的等待,大約5分鐘左右之后,這份由我+Kimi-Research共同撰寫的研究報告就完成了。

在這過程中,它出現(xiàn)了明顯的自主性,調(diào)用合適的工具完成任務,交付結果。

隨之輸出的,不僅是一份文字報告,還有一份網(wǎng)頁的可視化報告。

仔細看這份文字報告,它不止有文字,它還在每個引用的地方標注了參考來源。當我們點擊文字旁邊的方塊后,在右側會跳轉到對應的引用內(nèi)容,并且對于它引用的部分,還進行了高亮處理。

點進它引用的文章,跳轉頁面,我們又能看到一個細節(jié):

它從哪段開始引用的,在來源的網(wǎng)頁里,也給你標出來了。

仿佛真的是一名嚴謹專業(yè)的研究員。

而且….

我寫論文的時候,也沒有這么嚴謹好吧。

真正的做到了“可溯源”,確保了信息來源的可靠性。

在以前,為了防止AI隨意杜撰,捏造一些不存在的網(wǎng)頁,我都會在提示詞上加一段:“引用可靠的來源,不要隨意杜撰”。

但是現(xiàn)在,完全不需要了。

因為Kimi會自己幫助你驗證這些網(wǎng)站的可靠性,這就是它“懂我們沒說的”。

完整的文字報告太長了,我就不放了,大家可以在評論區(qū)回復,我會私發(fā)給你。

可視化報告如下:

網(wǎng)頁鏈接:https://www.kimi.com/preview/d1e1ln9sfuve986n5brg?blockId=18

在這個網(wǎng)頁里,我們能看到,它的左邊是有目錄的,點擊就能夠跳轉到對應章節(jié)。而且對于有需要的地方,它能夠幫你繪制表格,形狀,而且樣式還特別精美,保證你看了之后不會想打瞌睡。

只因你…你的報告,你做主。

考慮到大家的觀感…請點擊上面的網(wǎng)頁移步觀看,記得回來,因為精彩的內(nèi)容,才剛剛開始。

三、案例測試

之后,我又跑了好幾個案例,我將它的問題澄清部分和我的回復都放在下面,是不是夠強大,有沒有嚴格遵循我的指令,交給朋友們來評判,如果你要文字版本,歡迎在評論區(qū)留言:

1、提示詞的輸入對AI輸出結果的決定作用

提示詞:提示詞的輸入對于AI的輸出結果起到怎么樣的作用?請參考可靠的信息來源,從多方查證后,為我輸出一份深度研究的報告。

Kimi確認需求:

我的回復:

生成的可視化網(wǎng)頁:https://www.kimi.com/preview/d1e2pvope77i9aeu4itg?blockId=52

2、那藝娜為什么還能這么火?

提示詞:

那藝娜明明被拆穿了俄羅斯人的身份,為什么現(xiàn)在還那么火?

Kimi確認需求:

我的回復:

生成的可視化網(wǎng)頁:https://www.kimi.com/preview/d1e2ujo52cekgv1uhep0?blockId=18

3、Kimi從發(fā)布到今天的月活用戶變化

提示詞:

Kimi AI發(fā)展情況是怎么樣的?它的月活用戶量變動情況如何?未來它有可能怎么樣發(fā)展?請從Kimi的發(fā)布時間開始算起,直到今天2025年6月24日,參考可靠來源, 從多視角、多維度進行深度研究,為我生成報告。

Kimi確認需求:

我的回復:

生成的可視化網(wǎng)頁:https://www.kimi.com/preview/d1e36njlmiuf20s294n0?blockId=38

在這當中,Kimi-Research出現(xiàn)了一個很有意思的行為:它在沒有任何干預的情況下,察覺到了代碼存在問題,所以果斷放棄了代碼,選擇了直接撰寫報告。

具體為什么會這樣?

所謂“知其然知其所以然”,在研讀了月之暗面發(fā)布的技術解析博客后,我想試試看,用大家能聽得懂的語言,來為大家講解,在發(fā)起任務到完成交付的過程中,Kimi的這個Agent,用了怎么樣的技術,如果有不完全的地方,請大家見諒哈~

四、技術原理解析

1、端到端自主強化學習

首先,我們應該知道,什么是“端到端”,指的是“用戶輸入”到“交付結果”中間,沒有任何的人工干預,也不出現(xiàn)既定的套路模板,而是由Agent自行完成。Open AI的深度研究也采用了這樣的方式。

其次,“自主強化學習”,指的是模型能夠自動調(diào)用相關的工具,并且根據(jù)任務的進度能夠自行判斷哪個工具最為合適,不依賴我們的提示詞,自己就能夠走完全程。

2、獎勵機制

這是強化學習中很重要的一個概念。它能夠幫助模型分辨“好”與“不好”。

為什么會這樣?

在一開始的時候,就由人工進行標注,讓人類為模型的回答打分。

例如,面對“今晚去哪里吃飯”這個問題,模型給出的回答是“去找家餐廳吧”,對這個回答給予高分;而對“去廁所”這個回答給予低分,這樣就得到了原始的標注好的數(shù)據(jù)。

再根據(jù)標注好的數(shù)據(jù),來訓練一名“打分員”(獎勵模型),讓模型自己來判斷好與不好。每次生成回答后,“打分員”會對回答進行打分,模型再根據(jù)回答調(diào)整自己的解題思路(參數(shù)),這個過程中,模型的回答會越來越偏向于人類滿意的回答,這個過程就叫“強化學習”。

而在Kimi-Researcher中,使用的獎勵機制是兩種:

  • 格式獎勵:每當模型的操作不符合“操作手冊”的規(guī)范,它就會被扣錢(獲得負獎勵),從而幫助它的操作具有規(guī)范性和有效性,變成一名聽話的好員工。
  • 正確性獎勵:基于格式獎勵,對于模型符合操作規(guī)范的情況,將它最終輸出的答案與標準答案進行比較,這就促使它的每一步都是為了產(chǎn)生更好的。

然而,對于操作流程完全正確,答案符合標準的兩條答復,路徑較短、更高效的回答,會在一開始就能夠得到獎勵,從而幫助模型能夠更加有效率的完成任務。

3、上下文管理

對于更復雜、流程更繁瑣的任務,模型引入了上下文管理的方法,它就像聰明的學生,并不是每條消息都去記,而是會選擇更重要的,丟棄不必要的,從而有選擇性地去記憶,這樣就能獲取更多信息,實現(xiàn)更高的性能。

4、并行工具調(diào)用

為了完成任務,Kimi-Researcher攜帶了三樣工具。

  • 并行的實時內(nèi)部搜索工具:可以同時發(fā)起多個請求,縮短信息檢索的時間,從而更高效地找到答案,如果任務需要大量背景信息、專業(yè)知識,或者是某些特定的數(shù)據(jù),這個工具是很關鍵的。
  • 用于交互式網(wǎng)頁任務,基于文本的瀏覽器工具:它會模擬人類在網(wǎng)頁上的操作,例如點擊鏈接、提取特定區(qū)域的內(nèi)容,使得模型能夠在一些交互式的網(wǎng)頁中提取數(shù)據(jù)。
  • 用于自動執(zhí)行代碼的編碼工具:還記得剛剛截圖里我們看到的使用python編碼的操作嗎?它就是來自于這個編碼工具,它賦予了模型計算能力和數(shù)據(jù)處理能力,可以運行python代碼,對于收集到的數(shù)據(jù)進行分析和處理。

而這三個工具,都被放置在端到端的自主強化學習框架下,供模型自己選擇什么時候用什么工具,能夠更好完成任務。

五、怎么樣才能用上?

目前,Kimi官網(wǎng)已經(jīng)開放了對Kimi-Research的內(nèi)測申請。

電腦進入Kimi官方網(wǎng)站:https://www.kimi.com/

在輸入框下方,點擊“申請Kimi Research內(nèi)測”:

現(xiàn)在通過的時間應該蠻快的,不會超過半天,你填寫的手機號會收到一條短信,告訴你申請通過。

再次進入官網(wǎng),你會發(fā)現(xiàn),輸入框里多了一個按鈕:

這就說明你已經(jīng)可以用Kimi-Research,為你完成任務了。

需要注意的是,每個月20次使用額度,別一不小心就用完了~

Kimi-Research雖好,可別貪用哦~

誰需要Kimi-Research?

如果你是一名學生,你可以用它來幫你搞懂復雜難懂的概念,讓Kimi來當你的老師,陪伴你在學習道路上過五關斬六將;

如果你是數(shù)據(jù)分析從業(yè)者,那就更好辦了——Kimi會幫你自動篩除掉那些無用的、低質(zhì)量的信源,采用高質(zhì)量的、有效的,對你需要整合的數(shù)據(jù)進行深入分析;

如果你是一名學術研究人員,或者正在撰寫學術論文,你可以讓Kimi來幫你查找可靠的資料,省去你辛苦跑知網(wǎng)、維普、萬方,查找、閱讀論文的時間;

如果你是酷愛沖浪的選手,你也可以用Kimi,輕松得知一個梗的前世今生,就像我用它來分析為什么那藝娜會那么火的原因一樣,讓你輕松踩在浪潮前端,打破信息差,不掉隊。

….

更多好玩的場景,等你來發(fā)現(xiàn)。

六、Kimi,尚能飯否?

在以上的內(nèi)容中,我們一起跑了幾個任務,但是我心中仍舊有所懷疑,那就是:它和傳統(tǒng)意義上的深度研究,區(qū)別在哪?官方說它是一個Agent,真的做到了嗎?

于是,我把這個問題扔給了ChatGPT。

它對于Agent的定義,有點意思。

ChatGPT認為,合格的Agent應該做到五個方面,將單詞“Agent”拆分開來:

??

A-G-E-N-T

Awareness(有感知):能識別用戶意圖,哪怕用戶沒說,它也能做得好。能理解上下文,也能看懂網(wǎng)頁,讀懂文檔。

Goal-oriented(有目標):并不是像無頭蒼蠅一樣到處亂轉,而是有著清晰的結果導向,并且為了達到目標,而調(diào)用自身一切的資源。

Execution(能行動):能操作工具,完成任務。

Navigation(能規(guī)劃路徑):不只是將大目標拆分為子任務,而是有規(guī)劃的去執(zhí)行,不墨守成規(guī)。

Tuning(能自我調(diào)整):面對查詢到的數(shù)據(jù)有沖突,策略有錯誤的時候,它不鉆牛角尖,而是自己做決定,選擇更好的方案。

那從這一點看來,Kimi發(fā)布的首個Agent,確實成了。

為什么Kimi的第一個Agent,要做Researcher,這個看似好像沒有必要再繼續(xù)擴展的賽道?

官方的一句話,讓我淚目:

并且,在不久的將來,Kimi-Researcher 的基礎預訓練模型以及其背后的強化學習模型,會被開源出來,讓我們每個人都實現(xiàn)“研究自由”。

Kimi,尚能飯否?

答案是:能!并且肯定會繼續(xù)變好。

讓我們期待,Kimi重現(xiàn)輝煌的那一天。

感謝你的觀看,如果你覺得這篇文章有幫到你,是我的榮幸~

歡迎點贊、推薦、轉發(fā)給你那還在為了論文、為了報告而焦頭爛額的朋友。

如果你也用Kimi-Researcher整了更好玩的活,歡迎在評論區(qū)分享~

本文由 @ Simonlin(公眾號同名)原創(chuàng)投稿或授權發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載

題圖來自 Unsplash,基于CC0協(xié)議,該文觀點僅代表作者本人。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!