大模型開源開發(fā)趨勢(shì)報(bào)告:企業(yè)與開發(fā)者的必修課
2025 年,螞蟻開源聯(lián)合 Inclusion AI 發(fā)布《全球大模型開源開發(fā)生態(tài)全景與趨勢(shì)報(bào)告(2.0 版)》,通過(guò)篩選 Github 全域項(xiàng)目(含 114 個(gè)項(xiàng)目、覆蓋 22 個(gè)技術(shù)領(lǐng)域),呈現(xiàn)大模型開源生態(tài)核心態(tài)勢(shì):領(lǐng)域迭代迅猛(62% 項(xiàng)目誕生于 2022 年 “GPT 時(shí)刻” 后),中美主導(dǎo) 36 萬(wàn)開發(fā)者市場(chǎng),傳統(tǒng)開源定義被打破,AIAgent 聚焦 AI Coding 等方向、AIInfra 側(cè)重模型運(yùn)維與全生命周期管理,基座模型青睞 MoE 架構(gòu)等技術(shù)。
螞蟻開源聯(lián)合 Inclusion AI 在 2025 年發(fā)布了 2.0 版《全球大模型開源開發(fā)生態(tài)全景與趨勢(shì)報(bào)告》(下文簡(jiǎn)稱“報(bào)告”)。報(bào)告直接對(duì)Github下面的全域項(xiàng)目進(jìn)行檢索,通過(guò)分析開發(fā)者、項(xiàng)目、社區(qū)之間的互動(dòng)關(guān)系,評(píng)估各大大模型開源項(xiàng)目的影響力和開發(fā)者的貢獻(xiàn)度。
相比于今年5月份發(fā)布的1.0版本,報(bào)告剔除了1.0版本中的60個(gè)項(xiàng)目,新納入了39個(gè)項(xiàng)目,可以說(shuō)是非??陀^的反映了當(dāng)前開源生態(tài)下的技術(shù)和產(chǎn)品趨勢(shì)。如下圖所示,大模型開源開發(fā)生態(tài)全景圖中共有114個(gè)項(xiàng)目,覆蓋22個(gè)技術(shù)領(lǐng)域,整體分為AIAgent與AIInfra兩大方向。
(圖源 https://antoss-landscape.my.canva.site/)
報(bào)告從這100+項(xiàng)目中萃取以下觀點(diǎn):
1、大模型開發(fā)領(lǐng)域迭代極快。約62%的項(xiàng)目誕生于 2022 年“GPT 時(shí)刻”之后,項(xiàng)目平均“年齡”僅約 30 個(gè)月,說(shuō)明該領(lǐng)域迭代極快。
2、在大模型生態(tài)中中國(guó)和美國(guó)占主導(dǎo)地位。參與這些項(xiàng)目的全球開發(fā)者約36 萬(wàn)人,其中美國(guó)約占 24%、中國(guó)約占 18%,其次是印度、德國(guó)、英國(guó)等。
3、傳統(tǒng)的軟件開源定義逐步被顛覆。比如Dify、n8n等熱門開源項(xiàng)目都在開源許可上增加了用戶使用的限制,以保護(hù)自己的商業(yè)利益。比如Cursor等閉源項(xiàng)目并沒有在Github發(fā)布代碼,但通過(guò)Github收集用戶反饋。
4、在AI Agent層面,以AI Coding、聊天機(jī)器人、Agent開發(fā)框架為核心增長(zhǎng)領(lǐng)域。尤其是AI Coding,目前面向開發(fā)者的產(chǎn)品形態(tài)有CLI、IDE、插件、協(xié)作開發(fā)工作流4種形態(tài),產(chǎn)品功能也從最開始代碼補(bǔ)全升級(jí)到全棧式開發(fā)和項(xiàng)目協(xié)作。
(圖源 螞蟻開源公眾號(hào))
5、在AI Infra層面,以模型運(yùn)維、模型全生命周期管理為核心增長(zhǎng)領(lǐng)域,關(guān)注是的如何一站式地完成大模型訓(xùn)練、評(píng)測(cè)和部署,以及可靠地進(jìn)行大模型在線服務(wù)。值得一提的是,像英偉達(dá)等大廠也在布局Infra開源工具,以建造供自身商業(yè)化產(chǎn)品發(fā)展的技術(shù)護(hù)城河。
(圖源 螞蟻開源公眾號(hào))
6、在基座大模型技術(shù)架構(gòu)層面,MoE專家混合架構(gòu)逐漸被各大廠商所青睞,這種架構(gòu)一方面允許模型在訓(xùn)練時(shí)可以構(gòu)建更多參數(shù)的網(wǎng)絡(luò),另一方面通過(guò)動(dòng)態(tài)路由等手段降低了推理時(shí)的參數(shù)激活,減少了計(jì)算成本?;趶?qiáng)化學(xué)習(xí)的Reasoning能力也成為很多模型的必備能力,支持用戶根據(jù)不同的問(wèn)題場(chǎng)景使用不同的推理方式。同時(shí),多模態(tài)模型成為今年發(fā)布的焦點(diǎn),無(wú)論是視頻、圖像等生成都給到一些驚喜。下圖是螞蟻開源整理的從2025年1月-8月的基座大模型發(fā)布情況,可以清楚地印證這些觀點(diǎn)。
(圖源 螞蟻開源公眾號(hào))
從報(bào)告中對(duì)大模型生態(tài)的分析,我們可以獲得一些啟發(fā):
1、大模型工程化的能力很重要,比如工具調(diào)用、可靠服務(wù)、推理優(yōu)化等,這些將成為影響大模型融于業(yè)務(wù)場(chǎng)景的關(guān)鍵因素。
2、自研產(chǎn)品和技術(shù)的核心部門需要閉源,但是周邊的通用能力可以開源,從而擁抱大模型開源生態(tài)的注意力紅利。
3、報(bào)告強(qiáng)調(diào)要關(guān)注大模型項(xiàng)目的快速更迭與社區(qū)協(xié)作,建議在選型開源項(xiàng)目時(shí),不能僅僅看star數(shù),而是要參考項(xiàng)目提交頻率、issue 處理、貢獻(xiàn)者分布、依賴生態(tài)等來(lái)決定是否在生產(chǎn)使用。
參考
https://mp.weixin.qq.com/s/QRY5HBtZwrCZ95WHubTwsg
本文由人人都是產(chǎn)品經(jīng)理作者【明思AI】,微信公眾號(hào):【明思AI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!