DeepSeek R2要來了!大摩率先曝光,參數(shù)翻倍、推理成本暴降88%

1 評論 10684 瀏覽 5 收藏 8 分鐘

最近,摩根士丹利的一份研報提前曝光了R2的關(guān)鍵信息,引發(fā)了業(yè)內(nèi)的廣泛關(guān)注。本文將為你詳細解讀DeepSeek R2的核心亮點,供大家參考。

DeepSeek R2模型終于有新消息了!

最近,頂級投行摩根士丹利發(fā)布了一則研報,提前曝光了DeepSeek即將發(fā)布的全新一代模型——R2。

這個研報篇幅不長,但信息巨大。話不多說!快跟著烏鴉君一起來看看吧。

01 兩大核心亮點:參數(shù)翻倍,價碼暴跌88%

這次R2的核心變化有兩個:參數(shù)翻倍和成本下降。

先說前者,R2 模型的體量直接飆到1.2萬億參數(shù),是之前 R1 的兩倍多,活躍參數(shù)也從370億 漲到了780億,推理時調(diào)用更多“腦細胞”,意味著模型思考得更深,輸出質(zhì)量自然也水漲船高。

這種思路,其實和 Google 的 Gemini、Anthropic 的 Claude 類似——通過增加每次調(diào)用中參與運算的參數(shù)量來增強推理質(zhì)量。例如,Gemini 2.5 Pro使用的Token比R1-0528多30%。

雖然這會提升計算成本,但對于終端用戶來說,換來的是更聰明、更會“想事”的模型,值了。

另一大變化是,模型成本更便宜了。

根據(jù)大摩消息,R2的每百萬Token輸入成本只有0.07美元,比R1的0.15-0.16美元下降了一半還多;輸出成本更厲害,從原先R1模型的其每百萬Token2.19美元,大幅下降到0.27美元。

這個價格遠遠低于OpenAI的GPT-4o等最先進的模型。GPT-4o的API定價為輸入每1百萬個Token2.50美元,輸出每1百萬個Token 10.00美元。

也就是說,R2的價格比GPT-4o等最先進的模型便宜了97%。

對創(chuàng)業(yè)公司、開發(fā)者、企業(yè)來說,這無疑是巨大誘惑:不僅推理效果強,還能把使用成本打到地板價,商業(yè)化空間大大拓寬。

除了參數(shù)和價格,R2還有三大升級亮點:

1)多語言推理和代碼生成能力大幅提升。據(jù)說,DeepSeek正在優(yōu)先提升R2的編碼能力,以及英語以外語言的能力,以擴大該模型對全球受眾的潛在影響和適用性;

2)引入了更高效的 MoE混合專家架構(gòu),推理效率更高,激活參數(shù)選擇更智能。該架構(gòu)將人工智能模型分成獨立的子網(wǎng),這些子網(wǎng)根據(jù)輸入選擇性地激活。這種方法可以顯著降低預(yù)訓(xùn)練的計算成本,并實現(xiàn)更快的推理性能;

3)多模態(tài)支持更強,視覺能力也比之前更上一個臺階;

簡單來說,R2不僅“想得更深”,還能“看得更清楚”。

在性能提升的同時,DeepSeek也正在擺脫對H100的依賴,實現(xiàn)本土算力突破。

據(jù)大摩透露,這次 DeepSeek 并沒有依賴傳統(tǒng)的 NVIDIA H100 芯片,而是用上了華為的昇騰910B芯片集群。雖然生態(tài)上華為還追不上英偉達,但這已經(jīng)是國產(chǎn)芯片參與大模型實戰(zhàn)的重要突破了。

DeepSeek正在努力建立一個本地硬件供應(yīng)鏈,以減少對美國制造的芯片的依賴。時至今日,R2模型背后已經(jīng)形成了一個強大的本土供應(yīng)鏈體系。

02 版本優(yōu)化剛剛完成,R2還得等等?

目前,DeepSeek的模型家族主要有三大產(chǎn)品:

  • V系列(V1~V4):通用大模型,全面覆蓋推理、效率、Agent能力;
  • R系列(R1 → R2):專注深度推理、數(shù)學(xué)、工具鏈整合等能力;
  • Prover-V2:一個為數(shù)學(xué)生成專門優(yōu)化的模型;

其中,DeepSeek-Prover-V2于今年4月發(fā)布的新模型。Prover-V2并非通用的模型,而是一個高度專業(yè)化的數(shù)學(xué)證明模型,基于DeepSeek V3,采用了改進的MoE架構(gòu)和壓縮的kV緩存以減少內(nèi)存消耗。

拋開新發(fā)布的數(shù)學(xué)證明模型,DeepSeek的大模型升級路線主要有條:

  • V4:作為通用模型主線的全面迭代,強調(diào)推理性能、效率與 Agent 化能力的提升;
  • R2:作為 Reasoner 專線的強化升級,對標 OpenAI的o3后續(xù)迭代模型和 Gemini 2.5 Pro 0605&正式版&未來的Gemini 3,進一步提升數(shù)理+工具鏈+多步推理表現(xiàn);

從過去看,DeepSeek的模型迭代節(jié)奏比較固定,基本遵循“2小1大”的規(guī)律:即每兩個月會有一個小版本更新,接著進行一個大版本換代。

以通用模型V1為例,V1是在2023年11月發(fā)布,V2的發(fā)布時間則是2024年5月,而V3的發(fā)布時間則到了2024年12月。按這個節(jié)奏,2025年6、7月份,DeepSeek會有一個比較大的版本更迭。

就在R2發(fā)布前不久(同樣是5月29日),DeepSeek也發(fā)布了一個沒改版本號但改得不小的強化版 —— R1-0528。

雖然架構(gòu)沒動,但這版本引入了強化學(xué)習(xí)訓(xùn)練(RLHF),推理深度明顯加強。官方評估顯示:用了9900萬個token完成評測任務(wù),比原來的R1多了40%,思考更深、過程更復(fù)雜,表現(xiàn)當然更好。

成績單也很漂亮:

  • AIME 2024(數(shù)學(xué)競賽):+21分
  • LiveCodeBench(代碼生成):+15分
  • GPQA Diamond(科學(xué)推理):+10分
  • Humanity’s Last Exam(知識推理):+6分

用戶反饋也很正面,特別是在邏輯、編程和交互能力上提升顯著。

這次 R1-0528 升級得這么猛,很多人開始懷疑:這是不是就是傳說中的R2?不過目前官方并沒有正面回應(yīng),這個說法還沒實錘。

雖然大摩說R2快來了,但按 DeepSeek 一貫的節(jié)奏推測,真正的 R2 估計還得再等等。這波升級,更像是“壓線偷跑”的大版本優(yōu)化,而不是正代更新。

文/林白

本文由人人都是產(chǎn)品經(jīng)理作者【烏鴉智能說】,微信公眾號:【烏鴉智能說】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自DeepSeek官網(wǎng)截圖

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. DeepSeek R2拋棄了英偉達H100芯片,轉(zhuǎn)而采用華為昇騰910B芯片集群進行訓(xùn)練和推理。在FP16精度下,昇騰910B集群具備512 PetaFLOPS的計算能力,芯片使用效率高達82%,性能大約相當于英偉達上一代A100訓(xùn)練集群的91%。

    來自廣東 回復(fù)