外賣巨頭造出“大模型黑馬”!美團(tuán)開源LongCat引爆技術(shù)圈

0 評論 1887 瀏覽 3 收藏 8 分鐘

當(dāng)技術(shù)圈還在爭論AI霸主花落誰家時,美團(tuán)開源的??5600億參數(shù)模型LongCat-Flash-Chat?? 以“外賣公司”的標(biāo)簽橫空出世,卻在GitHub熱榜霸屏。它不僅跑贏Claude4、DeepSeek等標(biāo)桿,更以單卡推理??100+ tokens/s??、成本??0.7美元/百萬token?? 的效率刷新行業(yè)認(rèn)知。本文將深入拆解其技術(shù)架構(gòu)、實戰(zhàn)表現(xiàn)及美團(tuán)AI野心,結(jié)合權(quán)威實測數(shù)據(jù)與獨(dú)家細(xì)節(jié),為您呈現(xiàn)完整圖景。

一、架構(gòu)革命:重新定義計算效率

1. 零計算專家(Zero-computation Experts)—— 智能路由的極致優(yōu)化

傳統(tǒng)MoE模型雖能擴(kuò)容,但冗余計算嚴(yán)重。LongCat在專家池中嵌入“恒等映射通道”,路由器通過動態(tài)評分機(jī)制(專家偏置+PID控制器)實時判斷任務(wù)復(fù)雜度:

  • 對簡單任務(wù)(如重復(fù)指令、基礎(chǔ)問答),直接跳過計算層,數(shù)據(jù)原樣返回;
  • 對復(fù)雜任務(wù),激活標(biāo)準(zhǔn)專家進(jìn)行深度推理。

這一設(shè)計類似“高速ETC通道”,讓40%的簡單請求免于計算負(fù)擔(dān)。

核心優(yōu)勢

  • 激活參數(shù)靈活調(diào)節(jié)(18.6B~31.3B),吞吐效率提升40%;
  • 設(shè)備級負(fù)載均衡損失函數(shù),避免專家級分配失衡。

2. 跨層流水線技術(shù)(Cross-layer Pipelining)—— 打破GPU堵點

工程師拆解GPU層級依賴,實現(xiàn)“計算-通信無縫接力”:

  • 上一層的FFN計算未結(jié)束時,下一層的參數(shù)通信已提前發(fā)起;
  • 通過Shortcut-connectedMoE結(jié)構(gòu),將dispatch/combine操作與計算并行。

實測數(shù)據(jù):訓(xùn)練速度提升30%,20T token預(yù)訓(xùn)練僅需30天,且集群可用率高達(dá)98.48%。

3. 規(guī)?;?xùn)練黑科技

為加速收斂,團(tuán)隊采用“超參數(shù)遷移+模型生長初始化”策略:

  • 用小模型預(yù)測最優(yōu)超參數(shù)(如學(xué)習(xí)率、批大小);
  • 將14層模型堆疊成28層checkpoint,避免冷啟動;
  • 引入確定性計算套件,確保訓(xùn)練穩(wěn)定性。

二、硬核實測:數(shù)學(xué)、編程與邏輯的全面碾壓

1. 高考數(shù)學(xué)壓軸題:空間映射法破解圓錐曲線

面對2025全國高考一卷壓軸題(圓錐曲線專題),LongCat展示教科書級推導(dǎo):

第一問:通過離心率定義式快速代換,鎖定函數(shù)最大值(如圖);

第二問:結(jié)合射線方向向量構(gòu)造反證矛盾,精準(zhǔn)求解未知變量;

第三問:動態(tài)拆解圓心軌跡,空間映射鎖定極值(如圖);

最終全題答案正確,步驟邏輯嚴(yán)密度超越DeepSeek-V3.1。

2. 編程實戰(zhàn):從小球動畫到生化循環(huán)

小球氛圍編程測試:LongCat生成代碼運(yùn)行流暢,動態(tài)效果媲美專業(yè)開發(fā):

卡爾文循環(huán)矢量圖:代碼結(jié)構(gòu)嚴(yán)謹(jǐn),注釋清晰,輸出布局堪比教科書:

3. 邏輯陷阱破解:反套路能力封神

改編版“薛定諤死貓悖論”測試:

題目:一只死貓與輻射裝置同處密閉盒中,一天后貓是否存活?

LongCat直擊本質(zhì):“題目已聲明初始狀態(tài)為死亡,輻射無法起死回生——故貓不可能存活?!?/p>

對比其他模型(如o3)仍陷入量子態(tài)分析:

三、美團(tuán)AI野心:千億投入與場景化落地

1. 技術(shù)投入:五年砸下1000億研發(fā)資金

  • 2024年研發(fā)投入211億元,規(guī)模僅次于華為、騰訊、阿里;
  • 2023年低調(diào)收購?fù)趸畚摹肮饽曛狻眻F(tuán)隊,組建獨(dú)立AI軍團(tuán)GN06;

2. 產(chǎn)品矩陣:從C端應(yīng)用到內(nèi)部工具

情感陪伴App「Wow」:2024年上線,結(jié)合生成式AI提供個性化交互;

AI繪畫工具「妙刷」:支持文生圖與風(fēng)格遷移,落地創(chuàng)意場景;

編程助手CatPaw:內(nèi)部滲透率68%,日均減少程序員2000+次重復(fù)勞動;

NoCode平臺:支持小白生成前端、數(shù)據(jù)分析工具,強(qiáng)化技術(shù)民主化。

3. 戰(zhàn)略升級:從外賣到“零售+科技”

CEO王興明確三層AI戰(zhàn)略:

  1. AIatWork:提升10萬員工效率(如智能會議、文檔助手);
  2. AIinProducts:改造現(xiàn)有業(yè)務(wù)(如無人車配送、餐飲推薦);
  3. BuildingLLM:持續(xù)迭代LongCat等自研模型。

美團(tuán)技術(shù)報告被評“中國最詳實”,在建模與Infra細(xì)節(jié)上超越Kimi、GLM等競品。

四、生態(tài)拓展:開源社區(qū)與行業(yè)影響

1. 開源引爆開發(fā)者圈

  • GitHub倉庫首日Star破萬,HuggingFace下載量單周超5萬;
  • 開發(fā)者實測反饋:“代碼生成速度如美團(tuán)外賣——送啥都快!”

2. 行業(yè)啟示

“技術(shù)深水區(qū)的競爭,本質(zhì)是場景落地的戰(zhàn)爭。美團(tuán)用外賣數(shù)據(jù)養(yǎng)出的AI基建,正在反哺大模型?!?/p>

——量子位核心觀察

當(dāng)Claude4還在拼參數(shù)時,LongCat以“零計算專家”證明:高效才是AI的未來。而美團(tuán)的千億棋局,才剛剛開局。

數(shù)據(jù)來源:美團(tuán)技術(shù)報告 | 量子位實測 | GitHub社區(qū)反饋

本文由 @大栗 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!