DeepSeek新大招曝光:下一步智能體
在人工智能領(lǐng)域,DeepSeek一直以其強(qiáng)大的推理能力和創(chuàng)新的模型架構(gòu)引領(lǐng)著行業(yè)的發(fā)展。本文將深入探討DeepSeek的最新動態(tài),特別是其即將推出的具有更強(qiáng)大AI Agent能力的新模型。
DeepSeek下一步,被曝劍指智能體。
知情人士透露,DeepSeek正在開發(fā)具有更強(qiáng)大AI Agent能力的新模型,預(yù)計(jì)在今年年底就會推出。
官方尚無回應(yīng),但這一爆料并非無跡可尋。
在DeepSeek 8月的最近一次更新中,DeepSeek-V3.1上線。官方發(fā)布的升級公告中就提到:
DeepSeek-V3.1具備更強(qiáng)的Agent能力,通過Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
邁向Agent時代的第一步
“R2”將造更強(qiáng)智能體?
彭博社援引知情人士消息,爆料DeepSeek的下一個模型,僅需少量提示,就能幫用戶執(zhí)行復(fù)雜操作,并且還能根據(jù)歷史操作自我進(jìn)化和學(xué)習(xí)。
這一模型將在今年最后一個季度面世。
此前,業(yè)內(nèi)普遍推測,按照DeepSeek V3和DeepSeek R1的發(fā)布節(jié)奏,在被期待已久的“R2”之前,DeepSeek應(yīng)該會先一步推出新一代V系列的基礎(chǔ)模型。
而從去年12月到今年8月的近9個月時間里,DeepSeek V系列的版本號只從V3來到了V3.1。
看上去僅僅是小版本的改進(jìn),但從DeepSeek官方后來公布的測試結(jié)果來看,似乎又暗藏玄機(jī)。
DeepSeek-V3.1的主要升級包括3點(diǎn):
- 混合推理架構(gòu),就是把思考模式和非思考模式都集成到了一個模型里。
- 更高的思考效率,比DeepSeek-R1想得更快。
- 更強(qiáng)的Agent能力,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
具體來看提升效果。
編程智能體方面,在代碼修復(fù)測評SWE和命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測試中,DeepSeek-V3.1相較V3和R1有明顯提高。
而在搜索智能體測評中,相較于DeepSeek-R1-0528,DeepSeek-V3.1也展現(xiàn)出了全面的性能提升。
下一個DeepSeek時刻
DeepSeek R1將推理模型推向發(fā)展新高潮,成了攪動全球大模型行業(yè)格局的一尾鯰魚。
Manus讓智能體的概念火爆出圈,被稱為“第二個DeepSeek時刻”——
來到2025年的下半年,幾乎沒有大模型產(chǎn)品不談智能體。吳恩達(dá)也在最新Andrew’s Letters中提到:并行智能體正在成為提升AI能力的新方向。
早早預(yù)定2025年年度熱詞的DeepSeek和智能體一疊加,立刻又觸動了人們興奮的神經(jīng)。
已經(jīng)有人開始期待:如果是DeepSeek來做這件事,那智能體的價格門檻,真的要被打下來了。
但也有人保持懷疑:這個時候入局智能體,還算好時機(jī)嗎?
不管怎么說,可以確定的是,在2025年余下的最后1/3時間里,大模型領(lǐng)域的熱鬧依然將每天持續(xù)。
最后的最后,小小One More Thing一下,信源來自官方,妥妥靠譜:
Qwen 3 max也要來了嗎?
歡迎一起,見證下一個歷史時刻。
魚羊 發(fā)自 凹非寺
本文由人人都是產(chǎn)品經(jīng)理作者【量子位】,微信公眾號:【量子位】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自DeepSeek官網(wǎng)截圖
- 目前還沒評論,等你發(fā)揮!