天堂中文www,free×性护士vidos中国,国产成人精品97

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

MiniMax M1開源：一口生成3萬字吊打Gemini，智能體性價(jià)比完勝DeepSeek？

餅干哥哥

2025-06-20

0 評(píng)論 2233 瀏覽 0 收藏

10 分鐘

最近，MiniMax突然宣布開源其推理模型M1，這一舉動(dòng)在AI圈引起了巨大轟動(dòng)。M1憑借其1M的超長(zhǎng)上下文和卓越的推理性能，不僅在多個(gè)核心基準(zhǔn)測(cè)試中超越了Gemini 2.5 Pro，還以極高的性價(jià)比成為新一代開源戰(zhàn)神。本文將深入探討MiniMax M1的技術(shù)亮點(diǎn)、性能表現(xiàn)以及實(shí)際應(yīng)用場(chǎng)景，揭示它如何在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出，成為智能體時(shí)代的強(qiáng)大底座。

就在昨天凌晨！當(dāng)AI圈還在回味各路神仙打架時(shí)，沉寂已久的MiniMax突然扔出了一記重磅炸彈，開啟了他們的“MiniMax Week”！

第一天就直接王炸——開源首個(gè)推理模型M1！這波操作，直接給我整不會(huì)了…出手就是開源，還是在這么陰間的時(shí)間點(diǎn)，真的行！

我先說結(jié)論：M1憑借1M的超長(zhǎng)上下文和恐怖的推理性能，足以媲美Gemini 2.5 Pro，我愿敬稱為新一代開源戰(zhàn)神！

這不是又一個(gè)刷分的模型，這是一個(gè)真正為Agent時(shí)代打造的、能“干重活”的長(zhǎng)推理底座，性價(jià)比直接拉滿，讓DeepSeek和Kimi瞬間emo！

如何體驗(yàn)

MiniMax Agent 已進(jìn)入內(nèi)測(cè)。

可通過 Google 賬號(hào)登錄官網(wǎng) https://agent.minimax.io/ 免費(fèi)嘗鮮。

性能屠榜！1M上下文把Gemini拉下神壇？

是騾子是馬拉出來遛遛，直接看跑分！

在多個(gè)核心基準(zhǔn)上，M1的表現(xiàn)只能用“炸裂”來形容，尤其是在「超長(zhǎng)」上下文、軟件工程和工具調(diào)用等維度，直接超越了Qwen3和DeepSeek-R1等一眾開源好手。

這個(gè)上下文是什么概念？簡(jiǎn)單來說，可以一口氣生成3萬字的內(nèi)容。。我去，這不就一篇短篇小說了嗎

但最離譜的，還是MRCR（4-needle）這項(xiàng)測(cè)試！

很多人不知道這是個(gè)啥，簡(jiǎn)單說，它就是“大海撈針”測(cè)試的究極進(jìn)化版，專門考察模型在超長(zhǎng)對(duì)話中精準(zhǔn)回溯和理解復(fù)雜指代關(guān)系的能力。

在這個(gè)地獄難度的測(cè)試?yán)铮琈1的表現(xiàn)簡(jiǎn)直一柱擎天，直接屠榜，跟閉源王者Gemini 2.5 Pro肩并肩！

我相信用過Gemini 2.5 Pro的伙伴都知道，那玩意的上下文有多離譜，而現(xiàn)在，一個(gè)開源模型做到了！

我特么…這波直接干碎了所有人的質(zhì)疑！

技術(shù)扒一扒：省錢又省力，這波操作怎么做到的？

M1之所以能這么橫，背后是硬核的技術(shù)創(chuàng)新，招招打在效率和成本的痛點(diǎn)上。

首先是Lightning Attention機(jī)制。

這玩意兒是實(shí)現(xiàn)1M超長(zhǎng)上下文的核武器！它把傳統(tǒng)注意力機(jī)制O(L2)的平方級(jí)計(jì)算復(fù)雜度，硬生生壓到了近似O(L)的線性級(jí)別。這意味著什么？在生成10萬token時(shí)，M1的計(jì)算量（FLOPs）不到DeepSeek R1的一半，生成100K時(shí)更是只有后者的25%！

這效率，簡(jiǎn)直離譜！

其次是高達(dá)80K的“思考預(yù)算”。這才是“長(zhǎng)推理”的關(guān)鍵！

光能吃進(jìn)長(zhǎng)文本不算本事，能進(jìn)行超長(zhǎng)的、連貫的思考和輸出，才是真功夫。80K的輸出token，意味著M1在面對(duì)復(fù)雜任務(wù)時(shí)，可以寫出極其詳盡的思考過程，一步步拆解、驗(yàn)證、反思，而不是淺嘗輒止。這為智能體（Agent）的復(fù)雜規(guī)劃能力提供了堅(jiān)實(shí)的底座。

最后是自研的CISPO強(qiáng)化學(xué)習(xí)算法。

M1基于456B參數(shù)的MoE架構(gòu)（激活45.9B），但其強(qiáng)化學(xué)習(xí)（RL）成本低到令人發(fā)指：僅用512張H800，3周時(shí)間，花了53.47萬美元就完成了！背后的功臣就是CISPO，這個(gè)騷方法通過裁剪重要性采樣權(quán)重，極大提升了訓(xùn)練效率，實(shí)現(xiàn)了2倍加速。這不僅是技術(shù)上的勝利，更是對(duì)成本控制的極致詮釋，把“性價(jià)比”三個(gè)字刻在了骨子里。

實(shí)測(cè)為王！這玩意兒真的能干活嗎？

跑分再牛，不如實(shí)戰(zhàn)。我們把它丟進(jìn)了一些真實(shí)的、甚至變態(tài)的場(chǎng)景里，看看它到底能不能打！

測(cè)試一：超長(zhǎng)上下文處理

MiniMax Agent 基于其自研的 ABAB-01 系列模型，支持高達(dá) 400 萬 token 的超長(zhǎng)上下文窗口。

這相當(dāng)于什么概念？就是它能一口氣讀完《明朝那些事兒》，然后你問它“朱元璋在哪里第一次見到齊德”，它就能精準(zhǔn)地告訴你。

針對(duì)“長(zhǎng)上下文處理”能力的信息提取測(cè)試：

我把書籍《窮爸爸富爸爸》的PDF丟給了它，讓它給這本書寫概括和相關(guān)建議。之前用DeepSeek測(cè)，直接提示只讀了23%就崩了。而M1，出色地完成了任務(wù)，超長(zhǎng)上下文的魅力體現(xiàn)得淋漓盡致！

這體驗(yàn)，真的無敵！

測(cè)試二：PPT 制作

在這次更新中，一大亮點(diǎn)是能做漂亮的 PPT——職場(chǎng)牛馬必備技能。

對(duì)于 MiniMax Agent 來說，PPT 也是多模態(tài)的一種。看上去只是圖片和文字的結(jié)合，但無論從排版、內(nèi)容和圖案設(shè)計(jì)來講，都得有主題、有思路、有邏輯，講究一致性，并且還能根據(jù)主題主動(dòng)補(bǔ)全內(nèi)容，這才算是解放我們雙手的ai。

來自官方的一個(gè)案例：

幫我做一個(gè)面向初中生講解動(dòng)量守恒的ppt

最終生成的PPT截圖：

訪問：https://vdq166psnf.space.minimax.io/

測(cè)試三：編程能力（小槽點(diǎn)）

在代碼生成方面，M1能力在線，比如讓它做一個(gè)“打地鼠”游戲，很快就能生成可玩版本。但不得不吐槽一下，前端審美…有點(diǎn)直男。跟Gemini生成的頁面一比，確實(shí)還有進(jìn)步空間。

不過，瑕不掩瑜，功能實(shí)現(xiàn)是第一位的！

游戲開發(fā)測(cè)試：

使用 HTML, CSS, 和 JavaScript 創(chuàng)建一個(gè)簡(jiǎn)單的網(wǎng)頁版“打地鼠”游戲。規(guī)則如下：
游戲界面是一個(gè) 4×4 的網(wǎng)格。
每隔 1-2 秒，會(huì)有一只“地鼠”隨機(jī)出現(xiàn)在一個(gè)格子里。
玩家點(diǎn)擊“地鼠”即可得分，分?jǐn)?shù)需要實(shí)時(shí)顯示。
游戲包含一個(gè)“開始/重新開始”按鈕和一個(gè) 30 秒的倒計(jì)時(shí)。
請(qǐng)將所有代碼打包到一個(gè) index.html 文件中。