欧美日韩在线视频一区,亚洲+欧美+综合,欧美性猛交xxxxx按摩欧美

搜索

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

Kimi-Researcher首秀：這一波“深度研究”，打出了王者歸來的氣勢

Simonlin

2025-06-30

0 評論 1963 瀏覽 0 收藏

25 分鐘

最近有個問題，一直在困擾著我：為什么杭州和北京的AI公司那么多，而其他地方的相對就更少呢？

正好當時我申請內(nèi)測的Agent通過了，于是我就用它跑了一個深度研究的任務，然后就電腦就掛在那，干別的事情去了。

當我再次點開它的界面之后，任務已經(jīng)完成了，還為我生成了一份可視化的報告：

這是那份報告的頭圖。

講真的，看到這張圖片的那一刻，我腦中浮現(xiàn)了兩個字——

“精彩”。

一、Kimi的榮耀與滑鐵盧

如果你問我，國產(chǎn)AI這么多，哪一款讓我最覺得可惜，我會告訴你，是Kimi。

在早期，這個AI是我使用的最多，也認為是最好用的。

無他，因為它的長文本處理能力，在2024年的國產(chǎn)大模型中，堪稱頂流。

2023年10月，Kimi AI首次亮相，它主打的20萬字上下文長度在當時已經(jīng)是一個足夠驚艷的數(shù)字。之后的幾個月里，Kimi AI 的月活躍用戶（MAU）持續(xù)增長，從50萬到298萬，從2023年12月到2024年2月，只用了3個月時間。

而它背后的公司——月之暗面，也開始走入人們的視野。

2024年3月，月之暗面宣布Kimi支持200萬字的無損上下文輸入，引起了一波轟動，在5個月時間內(nèi)，上下文長度提升10倍，同時也引起了同行在長文本領域的“內(nèi)卷”，各大互聯(lián)網(wǎng)廠商紛紛跟進，開啟了“軍備競賽”式的競爭,Kimi也及時在B站投流，實現(xiàn)了用戶的快速增長。

之后的幾個月里，Kimi的月活躍用戶持續(xù)攀升，到2024年11月，據(jù)創(chuàng)始人楊植麟所說，已經(jīng)達到了3600萬。

按理說，如此猛的勢頭，Kimi應該繼續(xù)牛逼下去，直到“封神”。

可是，在2025年，Kimi卻遭遇了它最為強力的競爭對手。

2025年初，DeepSeek（深度求索）橫空出世，憑借開源+強大的技術實力，直接打擊了包括Kimi在內(nèi)的一眾競品。

2025年3月，DeepSeek月活躍用戶數(shù)達到1.94億，位居AI原生APP榜首，而Kimi的月活躍用戶則是從頂峰時期的3600萬下滑到了1830萬，位居第四。

在國內(nèi)AI用戶甚至是普通民眾的口中，“DeepSeek”成為了大家口中頻繁出現(xiàn)的詞匯，AI頂流的代名詞，直到今天。

而Kimi呢？

仿佛它的高光時刻，已經(jīng)過去，淪為了眾多新興AI的墊腳石。

我個人就有很深的體會，說實話，我已經(jīng)很久沒有點開Kimi的網(wǎng)頁或者APP了。

去年3月，Kimi風光無限，今年3月，Kimi卻沒能夠再次震撼世界。

然而，在AI圈大戰(zhàn)沒落下帷幕的時候，乾坤未定，一切皆有可能。

6月20號，月之暗面官方發(fā)布的一篇文章，讓我忍不住感嘆：原來不是Kimi握不動刀了，而是它拿起了板磚！

二、Kimi-Researcher，專為深度研究而生的Agent

1、你是否也有同感？

GDR（Google DeepResearch）一直是我很喜歡用的一個產(chǎn)品，動輒輸出十多頁、二十多頁的報告，總讓我有種莫名的“量大管飽”的滿足感…

不過，如果要說它有什么地方有待改進的話，作為資深用戶，我還是能提幾個出來的：對網(wǎng)絡環(huán)境要求極高…大家都知道，由于Gemini是國外的AI，所以如果要使用它的話，不得不用些特殊手段，這點就在無形當中制造了門檻；
當你發(fā)出指令的時候，它會先列出執(zhí)行步驟給你確認，但是假如我們自己都沒想清楚，那自然也沒有辦法進行修正，這種感覺，就像點外賣的時候沒選擇“需要餐具”一樣尷尬…
它開始干活的時候，真的是很嚴格地在按照流程來執(zhí)行，但是有時候太“按規(guī)矩辦事”，反而失去了一些靈動感，畢竟…哪位老板希望自己的員工只像老黃牛一樣吭哧吭哧地埋頭苦干呢…

但是這絲毫不影響我對Gemini的愛，充其量只是相當于，喜歡的女孩臉上長了青春痘，雖然影響了美貌，但是無傷大雅…

不過總是有些遺憾。

2、Kimi-Researcher，來了。

上周五，朋友群里轉發(fā)了一篇來自Kimi官方的公眾號文章，就講了一件事——他們發(fā)布了一款專門為了深度研究而生的Agent，并且現(xiàn)在開始了內(nèi)測。

這一下，好像平靜的水面投入了一顆巨石，激起千層浪…群炸了。

我也在第一時間就申請了內(nèi)測。

我也忘了是多久，反正就不超過一天的時間，當我再次點進Kimi官網(wǎng)的時候，輸入框下面就出現(xiàn)了一個“深度研究”的按鈕。

最近AI的活動賊多，群里幾乎每天都能收到“某某AI舉辦活動，地址在北京/杭州”這樣的消息。

每次有朋友說自己要去的時候，我內(nèi)心都涌現(xiàn)出一堆很復雜的情緒，總結兩個字：“羨慕”。

所以，我稍加思索之后，就輸入了這段話：

引用可靠來源，經(jīng)過多角度，多維度的分析，告訴我以下答案：

為什么AI公司基本都開在北京和杭州？

Kimi給我的回復是這樣的：

我們可以看到，它不是著急干活，而是要先向我確認我的具體需求。

這一步驟，叫做“澄清問題”。是當它理解問題時，主動反問，向用戶做確認，有的放矢。

其實我很怕麻煩，如果可以，我真想要的是當一名“甩手掌柜”，完全不插手，不參與。

但是這明顯不太可能。

因為一旦我真的當了甩手掌柜，那么結果就完全不是我可以控制的，甚至可能輸出一份與我的要求不符合的報告，不僅白白浪費時間，還給自己找罪受….

但是如果你要我說出個一二三來，準確表達我的需求，這又有點為難我了。

Kimi-Researcher直接像一名稱職的助理一樣，直接列出需要關注的點，讓我自己選擇，有了這一步操作，起碼能夠保證這份報告具有一定的聚焦。

然后，我就告訴它：

其實這一步我是感覺有些驚訝的。

因為我自己都沒注意到，我提出的“AI公司”這個概念太龐大了，但是Kimi注意到了，并且還向我發(fā)起了提問。

那在之后的時間里，我原本應該去干自己的事兒，坐等報告就好，但是奈何Kimi Research執(zhí)行任務的過程太精彩了，比小說還好看，一下子就吸引了我的眼球。

直到這里，我才想起，Kimi-Research，它就是一個Agent?。?/p>

Kimi-Research并沒有選擇一條道走到黑——只關注在這些特定問題上不懂變通，而是學會了自己思考。

這個部分，是它的深入思考：能夠自主梳理并理解需求，在這當中，我們只需要幫助它錨定需要聚焦的點就可以，其他的讓其自由發(fā)揮。

我們同樣，也能看到，它其實是有在提取關鍵詞，根據(jù)關鍵詞進行搜索的，而且它能夠篩選，把那些信息質(zhì)量高的來源主動摘取出來，作為報告的引用源。

而這，是它任務步驟中的“主動搜索”。

它在不需要人工干預的情況下，經(jīng)過推理之后自行采取更加合理的策略，使用更加高質(zhì)量的搜索來源。

在經(jīng)過不算太漫長的等待，大約5分鐘左右之后，這份由我+Kimi-Research共同撰寫的研究報告就完成了。

在這過程中，它出現(xiàn)了明顯的自主性，調(diào)用合適的工具完成任務，交付結果。

隨之輸出的，不僅是一份文字報告，還有一份網(wǎng)頁的可視化報告。

仔細看這份文字報告，它不止有文字，它還在每個引用的地方標注了參考來源。當我們點擊文字旁邊的方塊后，在右側會跳轉到對應的引用內(nèi)容，并且對于它引用的部分，還進行了高亮處理。

點進它引用的文章，跳轉頁面，我們又能看到一個細節(jié)：

它從哪段開始引用的，在來源的網(wǎng)頁里，也給你標出來了。

仿佛真的是一名嚴謹專業(yè)的研究員。

而且….

我寫論文的時候，也沒有這么嚴謹好吧。

真正的做到了“可溯源”，確保了信息來源的可靠性。

在以前，為了防止AI隨意杜撰，捏造一些不存在的網(wǎng)頁，我都會在提示詞上加一段：“引用可靠的來源，不要隨意杜撰”。

但是現(xiàn)在，完全不需要了。

因為Kimi會自己幫助你驗證這些網(wǎng)站的可靠性，這就是它“懂我們沒說的”。

完整的文字報告太長了，我就不放了，大家可以在評論區(qū)回復，我會私發(fā)給你。

可視化報告如下：

網(wǎng)頁鏈接：https://www.kimi.com/preview/d1e1ln9sfuve986n5brg?blockId=18

在這個網(wǎng)頁里，我們能看到，它的左邊是有目錄的，點擊就能夠跳轉到對應章節(jié)。而且對于有需要的地方，它能夠幫你繪制表格，形狀，而且樣式還特別精美，保證你看了之后不會想打瞌睡。

只因你…你的報告，你做主。

考慮到大家的觀感…請點擊上面的網(wǎng)頁移步觀看，記得回來，因為精彩的內(nèi)容，才剛剛開始。

三、案例測試

之后，我又跑了好幾個案例，我將它的問題澄清部分和我的回復都放在下面，是不是夠強大，有沒有嚴格遵循我的指令，交給朋友們來評判，如果你要文字版本，歡迎在評論區(qū)留言：

1、提示詞的輸入對AI輸出結果的決定作用

提示詞：提示詞的輸入對于AI的輸出結果起到怎么樣的作用？請參考可靠的信息來源，從多方查證后，為我輸出一份深度研究的報告。

Kimi確認需求：

我的回復：

生成的可視化網(wǎng)頁：https://www.kimi.com/preview/d1e2pvope77i9aeu4itg?blockId=52

2、那藝娜為什么還能這么火？

提示詞：

那藝娜明明被拆穿了俄羅斯人的身份，為什么現(xiàn)在還那么火？

Kimi確認需求：

我的回復：

生成的可視化網(wǎng)頁：https://www.kimi.com/preview/d1e2ujo52cekgv1uhep0?blockId=18

3、Kimi從發(fā)布到今天的月活用戶變化

提示詞：

Kimi AI發(fā)展情況是怎么樣的？它的月活用戶量變動情況如何？未來它有可能怎么樣發(fā)展？請從Kimi的發(fā)布時間開始算起，直到今天2025年6月24日，參考可靠來源，從多視角、多維度進行深度研究，為我生成報告。

Kimi確認需求：

我的回復：

生成的可視化網(wǎng)頁：https://www.kimi.com/preview/d1e36njlmiuf20s294n0?blockId=38

在這當中，Kimi-Research出現(xiàn)了一個很有意思的行為：它在沒有任何干預的情況下，察覺到了代碼存在問題，所以果斷放棄了代碼，選擇了直接撰寫報告。

具體為什么會這樣？

所謂“知其然知其所以然”，在研讀了月之暗面發(fā)布的技術解析博客后，我想試試看，用大家能聽得懂的語言，來為大家講解，在發(fā)起任務到完成交付的過程中，Kimi的這個Agent，用了怎么樣的技術，如果有不完全的地方，請大家見諒哈~

四、技術原理解析

1、端到端自主強化學習

首先，我們應該知道，什么是“端到端”，指的是“用戶輸入”到“交付結果”中間，沒有任何的人工干預，也不出現(xiàn)既定的套路模板，而是由Agent自行完成。Open AI的深度研究也采用了這樣的方式。

其次，“自主強化學習”，指的是模型能夠自動調(diào)用相關的工具，并且根據(jù)任務的進度能夠自行判斷哪個工具最為合適，不依賴我們的提示詞，自己就能夠走完全程。

2、獎勵機制

這是強化學習中很重要的一個概念。它能夠幫助模型分辨“好”與“不好”。

為什么會這樣？

在一開始的時候，就由人工進行標注，讓人類為模型的回答打分。

例如，面對“今晚去哪里吃飯”這個問題，模型給出的回答是“去找家餐廳吧”，對這個回答給予高分；而對“去廁所”這個回答給予低分，這樣就得到了原始的標注好的數(shù)據(jù)。

再根據(jù)標注好的數(shù)據(jù)，來訓練一名“打分員”（獎勵模型），讓模型自己來判斷好與不好。每次生成回答后，“打分員”會對回答進行打分，模型再根據(jù)回答調(diào)整自己的解題思路（參數(shù)），這個過程中，模型的回答會越來越偏向于人類滿意的回答，這個過程就叫“強化學習”。

而在Kimi-Researcher中，使用的獎勵機制是兩種：

格式獎勵：每當模型的操作不符合“操作手冊”的規(guī)范，它就會被扣錢（獲得負獎勵），從而幫助它的操作具有規(guī)范性和有效性，變成一名聽話的好員工。
正確性獎勵：基于格式獎勵，對于模型符合操作規(guī)范的情況，將它最終輸出的答案與標準答案進行比較，這就促使它的每一步都是為了產(chǎn)生更好的。

然而，對于操作流程完全正確，答案符合標準的兩條答復，路徑較短、更高效的回答，會在一開始就能夠得到獎勵，從而幫助模型能夠更加有效率的完成任務。

3、上下文管理

對于更復雜、流程更繁瑣的任務，模型引入了上下文管理的方法，它就像聰明的學生，并不是每條消息都去記，而是會選擇更重要的，丟棄不必要的，從而有選擇性地去記憶，這樣就能獲取更多信息，實現(xiàn)更高的性能。

4、并行工具調(diào)用

為了完成任務，Kimi-Researcher攜帶了三樣工具。

并行的實時內(nèi)部搜索工具：可以同時發(fā)起多個請求，縮短信息檢索的時間，從而更高效地找到答案，如果任務需要大量背景信息、專業(yè)知識，或者是某些特定的數(shù)據(jù)，這個工具是很關鍵的。
用于交互式網(wǎng)頁任務，基于文本的瀏覽器工具：它會模擬人類在網(wǎng)頁上的操作，例如點擊鏈接、提取特定區(qū)域的內(nèi)容，使得模型能夠在一些交互式的網(wǎng)頁中提取數(shù)據(jù)。
用于自動執(zhí)行代碼的編碼工具：還記得剛剛截圖里我們看到的使用python編碼的操作嗎？它就是來自于這個編碼工具，它賦予了模型計算能力和數(shù)據(jù)處理能力，可以運行python代碼，對于收集到的數(shù)據(jù)進行分析和處理。

而這三個工具，都被放置在端到端的自主強化學習框架下，供模型自己選擇什么時候用什么工具，能夠更好完成任務。