MiniMax M1開源:一口生成3萬字吊打Gemini,智能體性價(jià)比完勝DeepSeek?
最近,MiniMax突然宣布開源其推理模型M1,這一舉動(dòng)在AI圈引起了巨大轟動(dòng)。M1憑借其1M的超長(zhǎng)上下文和卓越的推理性能,不僅在多個(gè)核心基準(zhǔn)測(cè)試中超越了Gemini 2.5 Pro,還以極高的性價(jià)比成為新一代開源戰(zhàn)神。本文將深入探討MiniMax M1的技術(shù)亮點(diǎn)、性能表現(xiàn)以及實(shí)際應(yīng)用場(chǎng)景,揭示它如何在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出,成為智能體時(shí)代的強(qiáng)大底座。
就在昨天凌晨!當(dāng)AI圈還在回味各路神仙打架時(shí),沉寂已久的MiniMax突然扔出了一記重磅炸彈,開啟了他們的“MiniMax Week”!
第一天就直接王炸——開源首個(gè)推理模型M1!這波操作,直接給我整不會(huì)了…出手就是開源,還是在這么陰間的時(shí)間點(diǎn),真的行!
我先說結(jié)論:M1憑借1M的超長(zhǎng)上下文和恐怖的推理性能,足以媲美Gemini 2.5 Pro,我愿敬稱為新一代開源戰(zhàn)神!
這不是又一個(gè)刷分的模型,這是一個(gè)真正為Agent時(shí)代打造的、能“干重活”的長(zhǎng)推理底座,性價(jià)比直接拉滿,讓DeepSeek和Kimi瞬間emo!
如何體驗(yàn)
MiniMax Agent 已進(jìn)入內(nèi)測(cè)。
可通過 Google 賬號(hào)登錄官網(wǎng) https://agent.minimax.io/ 免費(fèi)嘗鮮。
性能屠榜!1M上下文把Gemini拉下神壇?
是騾子是馬拉出來遛遛,直接看跑分!
在多個(gè)核心基準(zhǔn)上,M1的表現(xiàn)只能用“炸裂”來形容,尤其是在「超長(zhǎng)」上下文、軟件工程和工具調(diào)用等維度,直接超越了Qwen3和DeepSeek-R1等一眾開源好手。
這個(gè)上下文是什么概念?簡(jiǎn)單來說,可以一口氣生成3萬字的內(nèi)容。。我去,這不就一篇短篇小說了嗎
但最離譜的,還是MRCR(4-needle)這項(xiàng)測(cè)試!
很多人不知道這是個(gè)啥,簡(jiǎn)單說,它就是“大海撈針”測(cè)試的究極進(jìn)化版,專門考察模型在超長(zhǎng)對(duì)話中精準(zhǔn)回溯和理解復(fù)雜指代關(guān)系的能力。
在這個(gè)地獄難度的測(cè)試?yán)铮琈1的表現(xiàn)簡(jiǎn)直一柱擎天,直接屠榜,跟閉源王者Gemini 2.5 Pro肩并肩!
我相信用過Gemini 2.5 Pro的伙伴都知道,那玩意的上下文有多離譜,而現(xiàn)在,一個(gè)開源模型做到了!
我特么…這波直接干碎了所有人的質(zhì)疑!
技術(shù)扒一扒:省錢又省力,這波操作怎么做到的?
M1之所以能這么橫,背后是硬核的技術(shù)創(chuàng)新,招招打在效率和成本的痛點(diǎn)上。
首先是Lightning Attention機(jī)制。
這玩意兒是實(shí)現(xiàn)1M超長(zhǎng)上下文的核武器!它把傳統(tǒng)注意力機(jī)制O(L2)的平方級(jí)計(jì)算復(fù)雜度,硬生生壓到了近似O(L)的線性級(jí)別。這意味著什么?在生成10萬token時(shí),M1的計(jì)算量(FLOPs)不到DeepSeek R1的一半,生成100K時(shí)更是只有后者的25%!
這效率,簡(jiǎn)直離譜!
其次是高達(dá)80K的“思考預(yù)算”。這才是“長(zhǎng)推理”的關(guān)鍵!
光能吃進(jìn)長(zhǎng)文本不算本事,能進(jìn)行超長(zhǎng)的、連貫的思考和輸出,才是真功夫。80K的輸出token,意味著M1在面對(duì)復(fù)雜任務(wù)時(shí),可以寫出極其詳盡的思考過程,一步步拆解、驗(yàn)證、反思,而不是淺嘗輒止。這為智能體(Agent)的復(fù)雜規(guī)劃能力提供了堅(jiān)實(shí)的底座。
最后是自研的CISPO強(qiáng)化學(xué)習(xí)算法。
M1基于456B參數(shù)的MoE架構(gòu)(激活45.9B),但其強(qiáng)化學(xué)習(xí)(RL)成本低到令人發(fā)指:僅用512張H800,3周時(shí)間,花了53.47萬美元就完成了!背后的功臣就是CISPO,這個(gè)騷方法通過裁剪重要性采樣權(quán)重,極大提升了訓(xùn)練效率,實(shí)現(xiàn)了2倍加速。這不僅是技術(shù)上的勝利,更是對(duì)成本控制的極致詮釋,把“性價(jià)比”三個(gè)字刻在了骨子里。
實(shí)測(cè)為王!這玩意兒真的能干活嗎?
跑分再牛,不如實(shí)戰(zhàn)。我們把它丟進(jìn)了一些真實(shí)的、甚至變態(tài)的場(chǎng)景里,看看它到底能不能打!
測(cè)試一:超長(zhǎng)上下文處理
MiniMax Agent 基于其自研的 ABAB-01 系列模型,支持高達(dá) 400 萬 token 的超長(zhǎng)上下文窗口。
這相當(dāng)于什么概念?就是它能一口氣讀完《明朝那些事兒》,然后你問它“朱元璋在哪里第一次見到齊德”,它就能精準(zhǔn)地告訴你。
針對(duì)“長(zhǎng)上下文處理”能力的信息提取測(cè)試:
我把書籍《窮爸爸富爸爸》的PDF丟給了它,讓它給這本書寫概括和相關(guān)建議。之前用DeepSeek測(cè),直接提示只讀了23%就崩了。而M1,出色地完成了任務(wù),超長(zhǎng)上下文的魅力體現(xiàn)得淋漓盡致!
這體驗(yàn),真的無敵!
測(cè)試二:PPT 制作
在這次更新中,一大亮點(diǎn)是能做漂亮的 PPT——職場(chǎng)牛馬必備技能。
對(duì)于 MiniMax Agent 來說,PPT 也是多模態(tài)的一種。看上去只是圖片和文字的結(jié)合,但無論從排版、內(nèi)容和圖案設(shè)計(jì)來講,都得有主題、有思路、有邏輯,講究一致性,并且還能根據(jù)主題主動(dòng)補(bǔ)全內(nèi)容,這才算是解放我們雙手的ai。
來自官方的一個(gè)案例:
幫我做一個(gè)面向初中生講解動(dòng)量守恒的ppt
最終生成的PPT截圖:
訪問:https://vdq166psnf.space.minimax.io/
測(cè)試三:編程能力(小槽點(diǎn))
在代碼生成方面,M1能力在線,比如讓它做一個(gè)“打地鼠”游戲,很快就能生成可玩版本。但不得不吐槽一下,前端審美…有點(diǎn)直男。跟Gemini生成的頁面一比,確實(shí)還有進(jìn)步空間。
不過,瑕不掩瑜,功能實(shí)現(xiàn)是第一位的!
游戲開發(fā)測(cè)試:
使用 HTML, CSS, 和 JavaScript 創(chuàng)建一個(gè)簡(jiǎn)單的網(wǎng)頁版“打地鼠”游戲。規(guī)則如下:
游戲界面是一個(gè) 4×4 的網(wǎng)格。
每隔 1-2 秒,會(huì)有一只“地鼠”隨機(jī)出現(xiàn)在一個(gè)格子里。
玩家點(diǎn)擊“地鼠”即可得分,分?jǐn)?shù)需要實(shí)時(shí)顯示。
游戲包含一個(gè)“開始/重新開始”按鈕和一個(gè) 30 秒的倒計(jì)時(shí)。
請(qǐng)將所有代碼打包到一個(gè) index.html 文件中。
才剛開始
MiniMax M1的發(fā)布只是開始,這不,今天又發(fā)了AI生視頻的海螺02
感興趣可以去測(cè)一下:https://hailuoai.video/create
網(wǎng)友實(shí)測(cè)效果非常絲滑。
MiniMax這種“左手模型,右手Agent”的打法,穩(wěn)扎穩(wěn)打,正在構(gòu)建一個(gè)從底層模型到上層應(yīng)用、數(shù)據(jù)飛輪自洽的堅(jiān)固生態(tài)。
當(dāng)別人還在為高昂的token成本發(fā)愁時(shí),MiniMax已經(jīng)把價(jià)格打了下去,把智能提了上來。
這一周,MiniMax的好戲才剛剛開始。
讓子彈再飛一會(huì)兒,讓我們繼續(xù)圍觀,看AI的這一把火,還能燒得多么熱烈!
本文由人人都是產(chǎn)品經(jīng)理作者【餅干哥哥】,微信公眾號(hào):【餅干哥哥AGI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!