国产精品18久久久久久麻辣,欧美黑人性暴力猛交喷水

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

DeepSeek R2要來了！大摩率先曝光，參數(shù)翻倍、推理成本暴降88%

烏鴉智能說

2025-06-07

1 評論 10684 瀏覽 5 收藏

8 分鐘

最近，摩根士丹利的一份研報提前曝光了R2的關(guān)鍵信息，引發(fā)了業(yè)內(nèi)的廣泛關(guān)注。本文將為你詳細解讀DeepSeek R2的核心亮點，供大家參考。

DeepSeek R2模型終于有新消息了！

最近，頂級投行摩根士丹利發(fā)布了一則研報，提前曝光了DeepSeek即將發(fā)布的全新一代模型——R2。

這個研報篇幅不長，但信息巨大。話不多說！快跟著烏鴉君一起來看看吧。

01 兩大核心亮點：參數(shù)翻倍，價碼暴跌88%

這次R2的核心變化有兩個：參數(shù)翻倍和成本下降。

先說前者，R2 模型的體量直接飆到1.2萬億參數(shù)，是之前 R1 的兩倍多，活躍參數(shù)也從370億漲到了780億，推理時調(diào)用更多“腦細胞”，意味著模型思考得更深，輸出質(zhì)量自然也水漲船高。

這種思路，其實和 Google 的 Gemini、Anthropic 的 Claude 類似——通過增加每次調(diào)用中參與運算的參數(shù)量來增強推理質(zhì)量。例如，Gemini 2.5 Pro使用的Token比R1-0528多30%。

雖然這會提升計算成本，但對于終端用戶來說，換來的是更聰明、更會“想事”的模型，值了。

另一大變化是，模型成本更便宜了。

根據(jù)大摩消息，R2的每百萬Token輸入成本只有0.07美元，比R1的0.15-0.16美元下降了一半還多；輸出成本更厲害，從原先R1模型的其每百萬Token2.19美元，大幅下降到0.27美元。

這個價格遠遠低于OpenAI的GPT-4o等最先進的模型。GPT-4o的API定價為輸入每1百萬個Token2.50美元，輸出每1百萬個Token 10.00美元。

也就是說，R2的價格比GPT-4o等最先進的模型便宜了97%。

對創(chuàng)業(yè)公司、開發(fā)者、企業(yè)來說，這無疑是巨大誘惑：不僅推理效果強，還能把使用成本打到地板價，商業(yè)化空間大大拓寬。

除了參數(shù)和價格，R2還有三大升級亮點：

1）多語言推理和代碼生成能力大幅提升。據(jù)說，DeepSeek正在優(yōu)先提升R2的編碼能力，以及英語以外語言的能力，以擴大該模型對全球受眾的潛在影響和適用性；

2）引入了更高效的 MoE混合專家架構(gòu)，推理效率更高，激活參數(shù)選擇更智能。該架構(gòu)將人工智能模型分成獨立的子網(wǎng)，這些子網(wǎng)根據(jù)輸入選擇性地激活。這種方法可以顯著降低預(yù)訓(xùn)練的計算成本，并實現(xiàn)更快的推理性能；

3）多模態(tài)支持更強，視覺能力也比之前更上一個臺階；

簡單來說，R2不僅“想得更深”，還能“看得更清楚”。

在性能提升的同時，DeepSeek也正在擺脫對H100的依賴，實現(xiàn)本土算力突破。

據(jù)大摩透露，這次 DeepSeek 并沒有依賴傳統(tǒng)的 NVIDIA H100 芯片，而是用上了華為的昇騰910B芯片集群。雖然生態(tài)上華為還追不上英偉達，但這已經(jīng)是國產(chǎn)芯片參與大模型實戰(zhàn)的重要突破了。

DeepSeek正在努力建立一個本地硬件供應(yīng)鏈，以減少對美國制造的芯片的依賴。時至今日，R2模型背后已經(jīng)形成了一個強大的本土供應(yīng)鏈體系。

02 版本優(yōu)化剛剛完成，R2還得等等？

目前，DeepSeek的模型家族主要有三大產(chǎn)品：

V系列（V1~V4）：通用大模型，全面覆蓋推理、效率、Agent能力；
R系列（R1 → R2）：專注深度推理、數(shù)學(xué)、工具鏈整合等能力；
Prover-V2：一個為數(shù)學(xué)生成專門優(yōu)化的模型；

其中，DeepSeek-Prover-V2于今年4月發(fā)布的新模型。Prover-V2并非通用的模型，而是一個高度專業(yè)化的數(shù)學(xué)證明模型，基于DeepSeek V3，采用了改進的MoE架構(gòu)和壓縮的kV緩存以減少內(nèi)存消耗。

拋開新發(fā)布的數(shù)學(xué)證明模型，DeepSeek的大模型升級路線主要有條：

V4：作為通用模型主線的全面迭代，強調(diào)推理性能、效率與 Agent 化能力的提升；
R2：作為 Reasoner 專線的強化升級，對標 OpenAI的o3后續(xù)迭代模型和 Gemini 2.5 Pro 0605&正式版&未來的Gemini 3，進一步提升數(shù)理+工具鏈+多步推理表現(xiàn)；

從過去看，DeepSeek的模型迭代節(jié)奏比較固定，基本遵循“2小1大”的規(guī)律：即每兩個月會有一個小版本更新，接著進行一個大版本換代。

以通用模型V1為例，V1是在2023年11月發(fā)布，V2的發(fā)布時間則是2024年5月，而V3的發(fā)布時間則到了2024年12月。按這個節(jié)奏，2025年6、7月份，DeepSeek會有一個比較大的版本更迭。

就在R2發(fā)布前不久（同樣是5月29日），DeepSeek也發(fā)布了一個沒改版本號但改得不小的強化版 —— R1-0528。

雖然架構(gòu)沒動，但這版本引入了強化學(xué)習(xí)訓(xùn)練（RLHF），推理深度明顯加強。官方評估顯示：用了9900萬個token完成評測任務(wù)，比原來的R1多了40%，思考更深、過程更復(fù)雜，表現(xiàn)當然更好。

成績單也很漂亮：

AIME 2024（數(shù)學(xué)競賽）：+21分
LiveCodeBench（代碼生成）：+15分
GPQA Diamond（科學(xué)推理）：+10分
Humanity’s Last Exam（知識推理）：+6分

用戶反饋也很正面，特別是在邏輯、編程和交互能力上提升顯著。

這次 R1-0528 升級得這么猛，很多人開始懷疑：這是不是就是傳說中的R2？不過目前官方并沒有正面回應(yīng)，這個說法還沒實錘。

雖然大摩說R2快來了，但按 DeepSeek 一貫的節(jié)奏推測，真正的 R2 估計還得再等等。這波升級，更像是“壓線偷跑”的大版本優(yōu)化，而不是正代更新。

文/林白

本文由人人都是產(chǎn)品經(jīng)理作者【烏鴉智能說】，微信公眾號：【烏鴉智能說】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自DeepSeek官網(wǎng)截圖

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

烏鴉智能說

人工智能新時代的商業(yè)智庫和價值燈塔

131篇作品 423255總閱讀量

Axure高保真教程：上傳表格數(shù)據(jù)

02-1712318 瀏覽

關(guān)于北美SaaS營銷，那些只有一線操盤手才知道的干貨

07-194679 瀏覽

G端項目產(chǎn)品化之路

12-296185 瀏覽

能吆喝但不賣座，小紅書能玩明白旅游電商么？

02-142221 瀏覽

FitXR聯(lián)手PICO，蘋果、Meta、騰訊布局，VR健身狂熱之年

05-103497 瀏覽

評論

汪仔9417

DeepSeek R2拋棄了英偉達H100芯片，轉(zhuǎn)而采用華為昇騰910B芯片集群進行訓(xùn)練和推理。在FP16精度下，昇騰910B集群具備512 PetaFLOPS的計算能力，芯片使用效率高達82%，性能大約相當于英偉達上一代A100訓(xùn)練集群的91%。

最近來自廣東回復(fù)