不怕模型混亂,OpenAI又推“全能?!盙PT-4.1,B端市場(chǎng)福音

0 評(píng)論 1787 瀏覽 1 收藏 6 分鐘

OpenAI再推新模型GPT-4.1,性能更強(qiáng)、成本更低,能否成為B端市場(chǎng)的“全能選手”?從多模態(tài)能力到編程表現(xiàn),這款模型能否扛起商業(yè)化大旗?

不怕模型混亂,OpenAI又推“全能?!盙PT-4.1,B端市場(chǎng)福音

OpenAI剛出官方博客,夸贊GPT-4.5是比 4 聰明10倍的模型,轉(zhuǎn)眼就又推出了GPT-4.1,還是非推理模型,還更便宜。

有網(wǎng)友評(píng)價(jià):“GPT-4.5甚至還沒(méi)來(lái)及說(shuō)再見(jiàn)!”而且這次沒(méi)說(shuō)明,為何數(shù)字命名又倒退了?難道Altman也分不清 9.9 和 9.11 的大?。?/p>

言歸正傳,OpenAI最新發(fā)布的三個(gè)新模型是:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

  • GPT-4.1 是 OpenAI 最新旗艦大模型,具有更好的編程與寫(xiě)作能力,支持最長(zhǎng) 100 萬(wàn) token 上下文,適用于復(fù)雜任務(wù)。
  • GPT-4.1 Mini 是中端任務(wù)模型,性能接近GPT-4o,但成本降低 83%。
  • GPT-4.1 Nano 是OpenAI最快+最便宜模型的本地運(yùn)行小模型,持 AI 智能硬件助手等邊緣應(yīng)用。

官方提到,4.1在編碼和指令跟蹤方面均有顯著提升,多模態(tài)能力提升巨大,實(shí)際上差不多提升了三分之一左右。

具體來(lái)說(shuō),GPT-4.1 被視為 GPT-4o 的全面升級(jí)版,具備更強(qiáng)的多模態(tài)處理能力、更大的上下文窗口(全部可處理 100 萬(wàn)個(gè) token),并且成本降低了 26%。

GPT-4.1 按延遲劃分的家庭智能

OpenAI又端出了一盤(pán)菜,琳瑯滿(mǎn)目的模型選擇,本質(zhì)上也沒(méi)有很大的差別,能力上也沒(méi)有拉開(kāi)絕對(duì)差距。

實(shí)際上,Altman也意識(shí)到這一問(wèn)題,宣稱(chēng)GPT-5 將整合語(yǔ)音、畫(huà)布、搜索、Deep Research 等功能?!拔覀兊囊粋€(gè)核心目標(biāo)是通過(guò)創(chuàng)建能夠使用所有工具、知道何時(shí)需要長(zhǎng)時(shí)間思考、并且適用于廣泛任務(wù)的系統(tǒng),來(lái)統(tǒng)一 o 系列模型和 GPT 系列模型?!?/p>

GPT-4.1有點(diǎn)GPT-5的影子了,意味著OpenAI也在嘗試初步解決模型雜亂這一問(wèn)題。

這次推出 GPT-4.1,核心目標(biāo)就是逐步淘汰一些舊模型。

此前官宣GPT-4 將于 2025 年 4 月 30 日從 ChatGPT 中退役,由更強(qiáng)的 GPT-4o 完全替代。 GPT-4.1未來(lái)也許會(huì)正在逐步取代 GPT-4o,目前除了文生圖能力還沒(méi)有,4.1已經(jīng)全面超越了4o。

而GPT-4.5 的預(yù)覽版將于 7月14 日從 API 中下線(xiàn),4.1成為主流To B服務(wù)模型,適用于大多數(shù)用戶(hù)和開(kāi)發(fā)者,具有更強(qiáng)的性能和更低的成本。

鯨哥個(gè)人認(rèn)為,GPT-5不會(huì)順利在第三季度推出,年底能出現(xiàn)就算不錯(cuò)了。

GPT-4.1可能是今年OPenAI扛大梁的模型,因此這款模型的能力邊界就值得關(guān)注。

在重要的 SWE-bench Verified 編程能力基準(zhǔn)測(cè)試中的得分比較,GPT-4.1 的任務(wù)完成率為54.60%,位列第四名。

看似成績(jī)不如Claude 3.7 sonnet、Gemini 2.5 Pro Exp這些老對(duì)手,但要注意第一名是不會(huì)發(fā)布的o3模型(未來(lái)直接融入GPT5一起發(fā)布)。

接下來(lái)研究4.1的多模態(tài)識(shí)別能力和代碼生成能力,鯨哥用第一時(shí)間免費(fèi)上線(xiàn) 4.1 API的 Windsurf,輸入圖片讓其生成動(dòng)態(tài)可視化網(wǎng)頁(yè),這樣識(shí)圖能力和代碼生成能力都可以體現(xiàn)。

審美距Claude3.7還有距離

另一方面,GPT-4.1 nano API定價(jià)和 Gemini Flash 幾乎相同,這是針對(duì)Google的又一次狙擊。

夠用且便宜,這是OpenAI在模型進(jìn)展不明顯的情況下,還要推出4.1的緣由,他需要4.1和競(jìng)爭(zhēng)對(duì)手搶占市場(chǎng),尤其是B端市場(chǎng),接替3.5和4o mini。

像DeepSeek一樣追逐技術(shù)高峰,至今官網(wǎng)沒(méi)解決經(jīng)常崩潰的用戶(hù)體驗(yàn)問(wèn)題。OpenAI在GPT-5來(lái)臨前,還需要兼顧商業(yè)化。

而且,據(jù)悉OpenAI 計(jì)劃在新一代推理模型(o3、o4),整合跨學(xué)科知識(shí)整合能力,并對(duì)該模型收取高達(dá) 2 萬(wàn)美元/月的費(fèi)用,大約是普通 ChatGPT Plus 訂閱價(jià)格的 1000 倍。

顯然不是給普通用戶(hù)準(zhǔn)備的,這次GPT-4.1也沒(méi)第一時(shí)間上ChatGPT,讓C端用戶(hù)第一時(shí)間體驗(yàn)。

期待GPT-4.1早日更新到ChatGPT,能力更強(qiáng),月費(fèi)也能更便宜。

本文由人人都是產(chǎn)品經(jīng)理作者【鯨選AI】,微信公眾號(hào):【鯨選AI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!