GPT-5發(fā)布的真相:搞錢,比AGI更重要

0 評論 2993 瀏覽 2 收藏 11 分鐘

GPT-5的發(fā)布引發(fā)了廣泛討論,但其背后的核心邏輯似乎并非單純的性能提升或?qū)GI(通用人工智能)的追求。本文將深入剖析GPT-5發(fā)布的真相,探討OpenAI為何將重點放在了“搞錢”而非單純的AGI突破上。從性能優(yōu)化、價格策略到用戶體驗的全面升級,GPT-5的發(fā)布不僅是技術(shù)的迭代,更是OpenAI在市場競爭中的一次戰(zhàn)略布局。

看過這次發(fā)布會的朋友,估計都有一個感覺這次發(fā)布會有點混亂,圖表標錯、現(xiàn)場演示有 bug、早期版本還有各種怪毛病。

這其實暴露了OpenAI在信息傳遞上的“左右為難”:

既想給用戶帶來更順滑的體驗,又想制造一次震撼全場的亮相。但因為這次實在等得太久(還直接跳過了 GPT-4.5 的命名),最后只能一次性全端放出。

這種“擰巴”的狀態(tài),也是OpenAI一直以來面臨的難題。這家估值 5000 億美元的公司,背著兩種截然不同的期待:

一邊是 AGI敘事要持續(xù)突破,一邊是 ChatGPT這個史上增長最快的消費級產(chǎn)品要穩(wěn)住盤子。

GPT-5不可能同時滿足這兩種期待,于是OpenAI做出了選擇:性能穩(wěn)步、價格下探,優(yōu)先鞏固市場地位,即便因此引發(fā)對AI長期路徑的爭議。這很可能也是未來一段時間大模型行業(yè)的主旋律——慢性能,快產(chǎn)品。

隨之帶來的結(jié)果是,GPT-5聚焦在了一個更現(xiàn)實的問題:怎樣讓普通人和企業(yè),真的用起來。比如,它有更低幻覺、更強的上下文能力,甚至不需要復(fù)雜的提示詞,就能把一個模糊的想法,變成一個可用的產(chǎn)品。

看起來,比起追求AGI,用更好地產(chǎn)品搞錢,才是OpenAI當下更重要的事情。

01 好用、便宜,還夠穩(wěn),這才是最強殺手锏

在X上,不少AI研究者對GPT-5的第一反應(yīng)是——失望;但99%的ChatGPT用戶,甚至一些平時批評OpenAI的人,這次都表示滿意。

原因很簡單:GPT-5的性能幾乎全線最佳,價格卻低到離譜。

先看能力。GPT-5并沒有帶來人們幻想的“指數(shù)級飛躍”,更像是一次穩(wěn)定的小步快走。

在各種主的流智力評測集里,GPT-5都高于o3水平,但整體差距不大。即使與其他模型相比,GPT-5大多數(shù)“智力”能力僅僅稍微高出競爭對手一點,部分能力甚至還并非SOTA。

如果單純智能水平來說,GPT-5很難說有什么跨越式的能力提升。

唯一提升比較大的地方是,在編程、推理等實際任務(wù)中,GPT-5的表現(xiàn)有肉眼可見的提升,尤其在thinking模式下,已經(jīng)微微壓過以編程見長的Claude 4.1 Opus。

更關(guān)鍵的是,體驗優(yōu)化。它在理解編程需求、修正錯誤、調(diào)用工具等細節(jié)上,比前代順暢很多,少了“修錯—出新錯”的循環(huán)。

不過,這次真正“炸裂”的不是性能,而是價格。

GPT-5頂配推理模型比Claude Sonnet便宜,編程能力還更強;GPT-5 mini、nano 直接殺到“白菜價”區(qū)間。

甚至還給到了API用戶幾乎沒法拒絕的價格:每百萬token輸入1.25美元、輸出10美元,比GPT-4o還便宜,甚至壓過一直主打低價的Gemini 2.5 Pro,同等級mini、nano的價格也全線低于主要競品。

在烏鴉君看來,這場發(fā)布會釋放了一個很明確的信號——擴規(guī)模不再是唯一方向,性能、價格、體驗的平衡正在成為下一階段的核心競爭力。

這意味著,大模型競爭可能會從“誰的模型更大”轉(zhuǎn)向“誰能用得更廣、跑得更穩(wěn)、付得起”。規(guī)模紅利見頂后,模型的可用性、成本控制能力、對開發(fā)者和企業(yè)的友好程度,將直接決定市場份額的分配。

OpenAI這次的策略,更像是一次全線布局:頂配模型守住性能優(yōu)勢,中小模型打到極致性價比,讓更多個人和企業(yè)用戶無門檻接入。這種打法不僅給競爭對手壓力,也在無形中拉高了整個行業(yè)的準入門檻。

換句話說,GPT-5不是一場“炫技秀”,而是一次市場格局的再平衡嘗試。

02 GPT-5正在抹掉Prompt的存在感

過去幾年,OpenAI每次發(fā)布會都在強調(diào)更高的跑分、更大的模型,讓人覺得他們在用“參數(shù)堆”堆出先進感。

但這次GPT-5給我的感覺不一樣。

比起遙遠的AGI愿景,GPT-5像是突然扎進了一個更現(xiàn)實的問題:怎樣讓普通人和企業(yè),真的用起來。

先從一個最容易感受到的變化說起:你不用再糾結(jié)選哪個模型了。

過去,推理型模型雖然能解決更復(fù)雜的任務(wù),但又慢又貴;小模型便宜快,卻容易出錯。很多人甚至從來沒見過推理型的真正實力。

現(xiàn)在,GPT-5解決了這個問題。它像個“調(diào)度系統(tǒng)”,會根據(jù)任務(wù)自動切換不同規(guī)模、不同能力的模型,還會動態(tài)決定思考多久。你不必在“省錢”還是“做好”之間搖擺,它替你算好,既省又對。

而當模型選擇的門檻被拿掉,下一個問題就浮現(xiàn)出來:很多人其實不知道該讓AI干什么。

面對代理型AI,這個問題更明顯——你明知道它能自主行動,卻卡在第一步,不知道該開口說啥。

GPT-5直接跳過這個環(huán)節(jié),你只需拋出一個模糊目標,它就會幫你拆成可執(zhí)行的步驟,給出方案,點頭確認,它就跑起來。

在執(zhí)行過程中,它還會順著結(jié)果自己往下走,不用你一條條喂指令。比如你說“幫我準備新品上線的推廣”,它會拉出完整的發(fā)布清單:SEO文章、社交媒體短帖、郵件文案,全部生成好,等你審核后,一鍵鋪開全平臺。

當它開始自己推進任務(wù),另一個好用的標志出現(xiàn)了——敢托付。

幻覺率是所有AI落地的生死線。GPT-5把事實錯誤率降到比GPT-4o低45%,比OpenAI o3低80%,幻覺率不到1%。

在工業(yè)環(huán)境或日常工作里,這意味著你可以放心把關(guān)鍵任務(wù)交給它。長文上下文能力也顯著提升。

在“大海撈針”測試中,GPT-5的準確率比o3提升近一倍。有人做了個實驗:在NVIDIA一份23頁、7800詞的財報紀要里,把“毛利率將改善并回到70年代中期”改成“60年代中期”。

GPT-4.1系列全沒看出來,GPT-5(甚至是價格只有1/20的nano版)直接指出:前后不一致。能在長文里抓住這種邏輯錯漏,這才是企業(yè)級場景需要的可靠性。

最后,也是讓我最驚訝的一點——它能把一個模糊的想法,變成一個可用的產(chǎn)品。

國外有位網(wǎng)友隨口說:“做個程序化的野獸派建筑生成器,我可以拖動編輯,讓它看起來很真實,好好想想。”

幾分鐘后,他就拿到一個能直接運行的3D城市構(gòu)建器:可以拖拽建筑、改外觀、選類型,還多了霓虹燈、汽車、動態(tài)鏡頭、保存系統(tǒng)——這些功能他根本沒提。更重要的是,它幾乎不會陷入傳統(tǒng)AI編碼的“修錯—出新錯”死循環(huán),就算貼上報錯,也能一次修好。

這個變化其實也在傳遞一個信號:提示詞是個過渡產(chǎn)物,不是最終形態(tài)。過去我們小心翼翼寫Prompt才能逼出好結(jié)果;現(xiàn)在,你只需給個方向,它就會自己跑下去,甚至替你想好下一步。

這才是GPT-5的真正分水嶺——它把復(fù)雜度藏起來,把可靠性交出來,把結(jié)果做出來。當性能、價格、體驗三條曲線同時被拉到最佳位置,“最好用”的那一刻就到了。

文/林白

本文由人人都是產(chǎn)品經(jīng)理作者【烏鴉智能說】,微信公眾號:【烏鴉智能說】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!