MiniMax發(fā)布周回顧!5天連炸5款A(yù)I神器:視頻 Agent、語音定制等等,零門檻成本吊打Gemini,OpenAI都懵了!
AI 圈風(fēng)起云涌,MiniMax 在發(fā)布周推出多款 AI 新品,包括推理模型、視頻生成工具和智能體應(yīng)用等,性能與性價(jià)比驚艷全場(chǎng),讓 AI 技術(shù)觸手可及。
上周的AI圈,簡直被MiniMax一家給承包了,搞了一場(chǎng)為期5天的“發(fā)布周”,發(fā)布的內(nèi)容一個(gè)比一個(gè)震撼!?。?/p>
從推理屠榜的M1大模型,到攻克物理難題的視頻生成,再到人人可用的Agent和聲音定制,這波操作直接把AI的門檻和成本打到了“骨折價(jià)”,OpenAI和谷歌看了都得懵圈。
由于餅干哥哥周末去了北京,這會(huì)才有空扒一扒這5天,MiniMax到底放了些什么“王炸”!
直達(dá)體驗(yàn):https://www.minimax.io/
第一天:重磅炸彈MiniMax-M1,推理屠榜,上下文卷到100萬!
周一凌晨,MiniMax直接扔出了一記重磅炸彈——MiniMax-M1,一個(gè)深度思考模型,直接對(duì)標(biāo)DeepSeek-R1和OpenAI的O系列。
先來看看有多猛?
- 上下文長度100萬tokens:全球最高水平,直接是DeepSeek R1的8倍!
- 思維預(yù)算高達(dá)80K:真正的“長考型”AI,思考深度離譜。
- 計(jì)算效率提升4倍:生成10萬token,算力只要DeepSeek的四分之一,省錢就是硬道理!
- 性能屠榜:全面超越Qwen3-235B、DeepSeek-R1,尤其在復(fù)雜編程、工具使用和長文本理解上,簡直是降維打擊。
數(shù)字看著頭疼?看下圖,MiniMax-M1在各項(xiàng)核心基準(zhǔn)上,特別是長上下文和軟件工程方面,把一眾對(duì)手甩在了身后。
怎么做到的?靠的是Hybrid-MoE架構(gòu)和自研的CISPO強(qiáng)化學(xué)習(xí)算法,不是靠堆料,而是真刀真槍練出來的“腦力”。這波操作,直接把開源模型的性能和性價(jià)比卷到了新高度!
第二天:視頻模型Hailuo 02,谷歌翻車的體操,它搞定了!
如果說M1是技術(shù)宅的狂歡,那第二天發(fā)布的Hailuo 02視頻模型,就是所有創(chuàng)作者的YYDS!
最炸裂的一點(diǎn)是,它攻克了“體操”這個(gè)AI視頻生成的“圖靈測(cè)試”!之前連谷歌Veo 3都在這上面翻了車,而Hailuo 02生成的體操運(yùn)動(dòng)員,動(dòng)作流暢,物理效果拉滿,簡直不可思議!
戳此體驗(yàn):https://hailuoai.video/
Hailuo 02主打的就是“超清畫質(zhì)”和“精準(zhǔn)響應(yīng)”:
- 原生支持1080p,畫面質(zhì)感直接拉滿。
- 極限物理表現(xiàn),不管是鏡子里的倒影,還是復(fù)雜的運(yùn)動(dòng)軌跡,都符合現(xiàn)實(shí)規(guī)律,不再是“恐怖谷”視頻。
- SOTA指令遵循,你敢寫多復(fù)雜的Prompt,它就敢給你多精準(zhǔn)的實(shí)現(xiàn)。
在權(quán)威榜單Artificial Analysis上,Hailuo 02直接沖到全球第二,把一眾國際大廠甩在身后。更要命的是價(jià)格,1000美元能生成的視頻秒數(shù),吊打所有對(duì)手,這性價(jià)比誰頂?shù)米“。?/p>
第三、四天:Agent雙雄齊發(fā),生產(chǎn)力真要變天了!
當(dāng)大家還沉浸在視頻模型的震撼中時(shí),MiniMax緊接著甩出了MiniMax Agent和Hailuo Video Agent,直接宣告Agent時(shí)代的平民化!
MiniMax Agent是一個(gè)能干大事的通用智能體。它就像一個(gè)“靠譜的人”,能多步規(guī)劃、靈活拆解任務(wù)、調(diào)用工具,最終交付結(jié)果。用它生成一個(gè)帶音頻的學(xué)習(xí)教程,或者快速開發(fā)一個(gè)前端動(dòng)畫網(wǎng)頁,都不在話下。正如官方所說,生產(chǎn)關(guān)系真的在變:
“Code is cheap,show me the requirement.” (代碼是廉價(jià)的,告訴我需求。)
總結(jié)起來,MiniMax Agent目前具有以下幾個(gè)特點(diǎn):
1.編程:
??包含更多組件和復(fù)雜跳轉(zhuǎn)邏輯
??能夠模擬用戶操作做非常全面的測(cè)試,不交付有bug的網(wǎng)頁
??重視界面設(shè)計(jì)的交互視覺效果和用戶體驗(yàn)
2.多模態(tài):
??除了支持長文本文件,也支持視頻、音頻、圖片等的全面理解
??內(nèi)置生圖、音頻生成、視頻生成等能力,一鍵直出圖文音并茂的作品
3.MCP擴(kuò)展
??內(nèi)置MiniMax MCP,多模態(tài)輸出能力強(qiáng)大且實(shí)惠
??集成常用Github/Gitlab、Slack、Figma等MCP,提高上下文,延展用戶辦公生活各種任務(wù)場(chǎng)景
而Hailuo Video Agent更是重量級(jí)!它是一個(gè)專為視頻創(chuàng)作打造的Agent。你再也不用苦惱分鏡、剪輯、配音了,只需要輸入想法、上傳圖片,它就能一鍵生成具有專業(yè)水準(zhǔn)的短片!想讓你的寵物貓當(dāng)快遞員?想做個(gè)敦煌壁畫風(fēng)的混剪?上傳張照片,剩下的交給它!
第五天:最終彈!聲音也能Prompt生成?
發(fā)布周的最后一天,MiniMax帶來了收官之作——語音設(shè)計(jì)工具。
戳此體驗(yàn):https://www.minimaxi.com/audio
這玩意兒就更神了!你只需要在輸入框里用文字描述你想要的聲音,比如“嚴(yán)厲的數(shù)學(xué)老師”、“可愛活潑的女孩聲音”,它會(huì)一次性生成3個(gè)符合要求但音色、語氣、節(jié)奏略有不同的語音,選擇自己喜歡的即可!目前可選擇語音的語種僅支持英文或中文普通話。
來自官方的一個(gè)音色庫:
“呵,五岳劍派,哎呀呀,別用這種眼神看著我嘛,人家可是一片好心呢。呵呵,聽說你們掌門身體有恙,可要試試本宮這上等的丹藥?”
最終生成的音頻如下:
這意味著,無論是做視頻配音,還是開發(fā)個(gè)性化應(yīng)用,你都能擁有一個(gè)獨(dú)一無二的、用Prompt創(chuàng)造出來的聲音。之前只有ElevenLabs等少數(shù)公司能玩,現(xiàn)在MiniMax直接把它集成到了自己的生態(tài)里,而且門檻極低。Intelligence with Everyone
回顧MiniMax這瘋狂的一周,從底層模型到上層應(yīng)用,從文本、視頻到語音、Agent,它用五款產(chǎn)品清晰地展示了自己的全棧能力和野心。它的核心理念“Intelligence with Everyone”(讓智能普惠每個(gè)人)不再是一句口號(hào)。
Andrej Karpathy曾預(yù)言,最火的編程語言將是英語(自然語言)。
MiniMax用行動(dòng)證明,自然語言不僅能編程,還能創(chuàng)造視頻、設(shè)計(jì)聲音、完成復(fù)雜工作流。
大模型的內(nèi)卷遠(yuǎn)未結(jié)束,但MiniMax這波操作,無疑是把技術(shù)和產(chǎn)品的“性價(jià)比”與“易用性”推向了一個(gè)全新的高度。接下來,就讓我們繼續(xù)圍觀,看這場(chǎng)AI革命如何改變世界吧!
本文由人人都是產(chǎn)品經(jīng)理作者【餅干哥哥】,微信公眾號(hào):【餅干哥哥AGI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!