估值3.6萬(wàn)億元的OpenAI發(fā)布GPT-5,是技術(shù)飛躍還是商業(yè)營(yíng)銷?

0 評(píng)論 1308 瀏覽 2 收藏 15 分鐘

GPT-5來(lái)了,OpenAI估值飆至3.6萬(wàn)億元。但這一次,我們不只看參數(shù)升級(jí),更要看它背后的“意圖”:是技術(shù)的又一次躍遷,還是一次精心策劃的商業(yè)敘事?本文將從模型演進(jìn)、產(chǎn)品策略、估值邏輯三方面,拆解GPT-5的真正意義。

一、GPT-5發(fā)布10天了

北京時(shí)間25年8月8日凌晨,OpenAI發(fā)布GPT-5,至今已過(guò)去10天,10天時(shí)間基本能判斷出市場(chǎng)對(duì)GPT-5的反應(yīng):是超出預(yù)期還是不及預(yù)期,是驚喜多還是失望多。

對(duì)于GPT-5的發(fā)布,大家都有很高的期待,因?yàn)榫嚯x2023年3月發(fā)布的GPT-4過(guò)去將近2年半了。對(duì)于快速發(fā)展的AI領(lǐng)域來(lái)講,2年半的時(shí)間能做很多事。

在這兩年多內(nèi),全球很多AI大模型誕生了,比如2023年3月發(fā)布的Claude,2023年11月發(fā)布的DeepSeek,2023年12月發(fā)布的Gemini等等。這些大模型,在發(fā)布之后快速發(fā)展,并在競(jìng)爭(zhēng)激烈的AI領(lǐng)域占據(jù)了一席之地。

過(guò)去有觀點(diǎn)認(rèn)為,OpenAI將在AI領(lǐng)域構(gòu)建自身強(qiáng)大的競(jìng)爭(zhēng)壁壘,實(shí)現(xiàn)一家獨(dú)大,其他AI公司只能分得很少一部分市場(chǎng)。

但是從最新的情況來(lái)看,AI的發(fā)展將會(huì)是百家爭(zhēng)鳴的局面,沒(méi)有一家公司能完全占據(jù)絕對(duì)主導(dǎo)地位,而是很多AI大模型并存,并且不同大模型有自己的優(yōu)勢(shì)、特色,或在垂直細(xì)分賽道保持領(lǐng)先。

這次GPT-5的發(fā)布,對(duì)OpenAI至關(guān)重要,因?yàn)樽罱鼛啄旰芏郃I大模型誕生并高速發(fā)展,未來(lái)OpenAI是否能持續(xù)保持領(lǐng)先地位,甚至拉開(kāi)差距,GPT-5的表現(xiàn)非常關(guān)鍵。

目前來(lái)看,GPT-5并沒(méi)有重大創(chuàng)新突破,實(shí)現(xiàn)技術(shù)飛躍。比較大的改變,是將o系列(推理模型)和GPT系列(大語(yǔ)言模型)的模型進(jìn)行整合,實(shí)現(xiàn)系統(tǒng)自動(dòng)路由機(jī)制,而不是人為手工選擇模型。

在GPT-5的發(fā)布會(huì)上,OpenAI的CEO奧爾特曼說(shuō)“GPT-3像高中生,GPT-4像大學(xué)生,而GPT-5則能達(dá)到博士水平”。但是從使用效果和用戶反饋來(lái)講,并沒(méi)有達(dá)到預(yù)期。

有人認(rèn)為,這次GPT-5發(fā)布是OpenAI為了搶占更多市場(chǎng)的商業(yè)營(yíng)銷行為。甚至有人評(píng)價(jià)說(shuō)不應(yīng)該叫GPT-5,應(yīng)該叫GPT-4.9。

與此同時(shí),根據(jù)25年8月最新報(bào)道,OpenAI正以5000億美元(約為3.6萬(wàn)億元)的估值,出售約60億美元的員工股權(quán)。這也是目前全球估值最高的獨(dú)角獸。

就在25年6月,胡潤(rùn)研究院發(fā)布的《2025全球獨(dú)角獸榜》中,當(dāng)時(shí)SpaceX估值2.6萬(wàn)億元。這一估值比OpenAI最新估值低了1萬(wàn)億元。

有評(píng)論認(rèn)為,若OpenAI已經(jīng)上市,GPT-5的發(fā)布將會(huì)讓其市值大跌。盡管如此,GPP-5仍然有一些值得我們關(guān)注的亮點(diǎn)。

二、GPT-5有什么亮點(diǎn)

GPT-5的一個(gè)亮點(diǎn)在于采用動(dòng)態(tài)路由的多模型混合架構(gòu),將大語(yǔ)言模型GPT系列和推理模型o系列融合,能根據(jù)用戶問(wèn)題自動(dòng)匹配最佳子模型,能更好地理解和生成多模態(tài)信息,同時(shí)在推理、上下文記憶和復(fù)雜任務(wù)協(xié)作的能力有了新的突破。

1、自動(dòng)匹配模型

GPT-5將大語(yǔ)言模型GPT系列和推理模型o系列進(jìn)行融合,構(gòu)建出全新的集成模型。

模型中的實(shí)時(shí)路由機(jī)制可根據(jù)對(duì)話類型、問(wèn)題復(fù)雜程度等因素,自動(dòng)選擇基礎(chǔ)模型或深度推理模型來(lái)處理問(wèn)題,解決了過(guò)去需要用戶手動(dòng)切換不同模型的繁瑣問(wèn)題。

2、幻覺(jué)減少

我們知道,AI幻覺(jué)是制約AI在更多領(lǐng)域、更廣泛使用的瓶頸,GPT-5在幻覺(jué)問(wèn)題上有了明顯的改善。

與GPT-4o相比,GPT-5產(chǎn)生事實(shí)錯(cuò)誤的概率降低了45%左右。在LongFact和FActScore基準(zhǔn)測(cè)試中,GPT-5的幻覺(jué)率比o3降低約80%,能為用戶提供更準(zhǔn)確、更可靠的答案。

在醫(yī)療基準(zhǔn)HealthBench上,GPT-5的錯(cuò)誤率僅為1.6%,相比GPT-4o的幻覺(jué)率降低了45%。這也讓AI首次在高風(fēng)險(xiǎn)領(lǐng)域建立一定的可信度,對(duì)AI在醫(yī)療領(lǐng)域落地帶來(lái)了一定的推動(dòng)作用。

3、編程能力更強(qiáng)

GPT-5的編程能力有了很大的提升,被稱為OpenAI迄今為止最強(qiáng)大的編碼模型。

我們知道,Claude在編程方面表現(xiàn)非常優(yōu)異。GPT-5和Claude 4在編程能力方面各有自己的優(yōu)勢(shì),很難判斷誰(shuí)更強(qiáng)。

如果注重綜合編程能力和效率,GPT-5表現(xiàn)更出色;若側(cè)重代碼質(zhì)量和特定領(lǐng)域編程,Claude 4則更有優(yōu)勢(shì)。

4、多模態(tài)處理能力

GPT-5支持文本、圖像、語(yǔ)音和視頻的多模態(tài)輸入輸出,能夠?qū)σ曈X(jué)、語(yǔ)音、視頻內(nèi)容進(jìn)行深度理解與生成。例如,上傳一張風(fēng)景照片,它不僅能描述畫(huà)面的內(nèi)容,同時(shí)能從專業(yè)角度進(jìn)行分析,并根據(jù)照片生成詩(shī)歌。

5、數(shù)學(xué)與邏輯的深度推理

在AIME數(shù)學(xué)競(jìng)賽中,GPT-5的準(zhǔn)確率達(dá)94.6%,啟用Python工具后更提升至99.6%。它的動(dòng)態(tài)推理引擎能針對(duì)復(fù)雜問(wèn)題主動(dòng)分配更多計(jì)算資源,實(shí)現(xiàn)從“秒答常規(guī)問(wèn)題”到“深度思考邏輯難題”的能力分層,展現(xiàn)出接近人類的推理節(jié)奏與認(rèn)知層次。

6、商業(yè)化落地的關(guān)鍵一步

OpenAI首次將GPT-5的基礎(chǔ)功能免費(fèi)開(kāi)放,并大幅降低API成本,輸入1.25美元/百萬(wàn)token,輸出10美元/百萬(wàn)token,mini與nano版本更便宜。通過(guò)“免費(fèi)+生態(tài)”策略讓GPT-5在發(fā)布一周內(nèi)就吸引了超百萬(wàn)開(kāi)發(fā)者,成為推動(dòng)AI大規(guī)模應(yīng)用的里程碑。

三、GPT-5的局限與不足

盡管GPT-5有不少亮點(diǎn),但仍存一些不足。如對(duì)多模態(tài)內(nèi)容判斷易出錯(cuò),處理復(fù)雜問(wèn)題時(shí)仍有錯(cuò)誤,寫作能力甚至有所下降,長(zhǎng)上下文理解穩(wěn)定性欠佳。此外,智能路由機(jī)制讓用戶無(wú)法選擇模型,可能導(dǎo)致輸出結(jié)果未達(dá)到部分用戶預(yù)期。

1、推理能力仍不穩(wěn)定

盡管GPT-5在某些復(fù)雜任務(wù)中展現(xiàn)出不錯(cuò)的推理能力,但仍然存在不穩(wěn)定的情況。比如OpenAI的CEO奧爾特曼曾讓GPT-5推薦AI為主題的電視劇,GPT-5推薦的第二部劇《開(kāi)發(fā)者》與AI無(wú)關(guān),反映出其推理能力存在不穩(wěn)定的情況。

2、寫作能力未達(dá)預(yù)期

有很多評(píng)論認(rèn)為,GPT-5的寫作能力不如GPT-4.5。這可能是因?yàn)橹悄苈酚刹呗詾樽非蟾祉憫?yīng)速度,默認(rèn)調(diào)用了創(chuàng)造性和文采較差的模型,也可能是訓(xùn)練數(shù)據(jù)側(cè)重事實(shí)、邏輯、代碼和推理能力,犧牲了語(yǔ)言模型的文學(xué)性和創(chuàng)造性。

此外,部分用戶反映GPT-5存在中文輸入處理不佳的情況,在處理中文相關(guān)任務(wù)時(shí),可能無(wú)法達(dá)到與處理英文任務(wù)相同的效果,影響了其在中文語(yǔ)境下的使用體驗(yàn)。

3、用戶選擇權(quán)受限

GPT-5的智能路由策略會(huì)自動(dòng)判斷用戶問(wèn)題類型并選擇模型處理,這可能導(dǎo)致高級(jí)用戶無(wú)法精確控制使用哪個(gè)模型,從而難以確保結(jié)果的穩(wěn)定性和可預(yù)測(cè)性。如果路由模型對(duì)用戶意圖的識(shí)別出現(xiàn)偏差,最終的輸出質(zhì)量就可能不盡人意。

所以,有用戶評(píng)論說(shuō),如果GPT-5不恢復(fù)用戶自主選擇模型的功能,就選擇不使用GPT-5。

4、缺乏溫度引發(fā)不滿

OpenAI為提升專業(yè)性犧牲對(duì)話溫度,引發(fā)用戶的不滿。

有用戶通過(guò)實(shí)測(cè)顯示:生成生日邀請(qǐng)函時(shí),GPT-4o生成的作品更有溫度和有趣,GPT-5產(chǎn)出的作品顯得很生硬、機(jī)械。這也說(shuō)明了AI情感價(jià)值與專業(yè)價(jià)值的對(duì)立關(guān)系:越精準(zhǔn)越冷漠,越共情越冗余。

OpenAI的CEO說(shuō),GPT-5致力于為用戶帶來(lái)更為精準(zhǔn)的信息,而不是單純追求信息數(shù)量的堆砌。

但更精準(zhǔn)的信息很難定義,有時(shí)候需要用戶自己從信息中選擇自己需要的,而不是完全替用戶做決定。

四、OpenAI發(fā)展史

在介紹完最新發(fā)布的GPT-5之后,我們?cè)賮?lái)回顧一下OpenAI的發(fā)展史和OpenAI鮮為人知的事。

1、OpenAI的發(fā)展歷程

(1)2015年12月,OpenAI由薩姆?奧爾特曼、埃隆?馬斯克、彼得?蒂爾等硅谷科技巨頭聯(lián)合成立。是一家致力于研究和部署人工智能的公司,總部位于美國(guó)舊金山。起初是非營(yíng)利組織,旨在開(kāi)發(fā)安全友好的通用人工智能(AGI),并造福全人類。

(2)2016年,發(fā)布開(kāi)源工具包OpenAI Gym,為研究人員提供了測(cè)試和開(kāi)發(fā)強(qiáng)化學(xué)習(xí)算法的平臺(tái)。

(3)2018年,發(fā)布GPT-1,參數(shù)規(guī)模達(dá)到1.17億,開(kāi)啟生成式預(yù)訓(xùn)練模型時(shí)代。

(4)2019年,發(fā)布GPT-2,參數(shù)規(guī)模15億,首次驗(yàn)證了大規(guī)模無(wú)監(jiān)督預(yù)訓(xùn)練模型在多任務(wù)學(xué)習(xí)中的有效性,成為自然語(yǔ)言處理領(lǐng)域的里程碑。同年,OpenAI從非營(yíng)利模式轉(zhuǎn)向有限營(yíng)利模式,成立OpenAI LP。

(5)2020年,發(fā)布GPT-3,參數(shù)規(guī)模1750億,具備用零樣本學(xué)習(xí)方法解決一系列類比問(wèn)題的初步能力。被動(dòng)形成了類似人類類比推理能力的機(jī)制,并展現(xiàn)強(qiáng)大文本生成能力。

2021年,發(fā)布DALL-E,首次實(shí)現(xiàn)文本生成圖像的突破,激發(fā)了全球?qū)Χ嗄B(tài)生成模型的研究熱潮。

(6)2022年,發(fā)布聊天機(jī)器人程序ChatGPT,專注于對(duì)話場(chǎng)景,通過(guò)RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù)使其回答更加準(zhǔn)確、安全且符合人類價(jià)值觀,并展現(xiàn)出前所未有的交互能力。5天用戶破百萬(wàn),成為史上增長(zhǎng)最快的應(yīng)用。

(7)2023年,發(fā)布GPT-4,這是一個(gè)大規(guī)模的多模態(tài)模型,可以接受文本和圖像作為輸入,并輸出文本。其深度推理、邏輯和解決復(fù)雜問(wèn)題的能力遠(yuǎn)超之前的模型,在多個(gè)專業(yè)和學(xué)術(shù)領(lǐng)域表現(xiàn)出人類水平。

(8)2024年,發(fā)布Sora,這是一個(gè)文本生成視頻的模型,能夠根據(jù)提示詞生成逼真、連貫的一分鐘視頻,在視頻生成領(lǐng)域?qū)崿F(xiàn)了類似GPT-3之于文本的飛躍。被稱為“內(nèi)容創(chuàng)作革命”。

同年,發(fā)布GPT-4o,這是OpenAI首個(gè)端到端、原生全能多模態(tài)模型,將文本、音頻和視覺(jué)處理整合在同一個(gè)神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)了極低延遲的實(shí)時(shí)語(yǔ)音對(duì)話,能夠感知并回應(yīng)用戶的情緒和語(yǔ)調(diào),交互體驗(yàn)極其自然。

2、OpenAI鮮為人知的事

(1)根據(jù)2025年6月胡潤(rùn)百富發(fā)布的《2025全球獨(dú)角獸榜》,OpenAI估值2.2萬(wàn)億元。據(jù)了解,目前微軟已累計(jì)為OpenAI投入130億美元,占有49%的股份。

就在2個(gè)月后,OpenAI估值就達(dá)到5000億美元(約為3.6萬(wàn)億元)。

(2)埃隆?馬斯克參與了OpenAI的創(chuàng)辦,后來(lái)因理念不合退出董事會(huì),引發(fā)首次內(nèi)部爭(zhēng)議。

(3)OpenAI創(chuàng)始人兼CEO奧爾特曼是一位連續(xù)創(chuàng)業(yè)者。2005年,他從斯坦福大學(xué)計(jì)算機(jī)科學(xué)專業(yè)輟學(xué)創(chuàng)業(yè),同好友合作創(chuàng)辦社交媒體公司Loopt。2015年參與創(chuàng)建OpenAI,在2023年,他經(jīng)歷了被OpenAI董事會(huì)閃電免職,最終官?gòu)?fù)原職的戲劇性一幕。

五、結(jié)語(yǔ)

當(dāng)AI技術(shù)狂熱退潮,才是真正展現(xiàn)實(shí)力的時(shí)候。

我們看到GPT-5有亮點(diǎn),也有不足??梢钥隙ǖ氖?,GPT-5并沒(méi)有進(jìn)一步拉開(kāi)跟其他AI大模型之間的差距。

就像8月8日凌晨的GPT-5發(fā)布會(huì)上出現(xiàn)的低級(jí)錯(cuò)誤:數(shù)值大的柱狀圖比數(shù)值小的柱狀圖更短,這也說(shuō)明OpenAI的這場(chǎng)發(fā)布會(huì)準(zhǔn)備不足,顯得很匆忙,跟新發(fā)布的GPT-5這款產(chǎn)品一樣,存在瑕疵。

很多人說(shuō),GPT-5更像是一場(chǎng)商業(yè)營(yíng)銷發(fā)布會(huì),而不是技術(shù)創(chuàng)新突破發(fā)布會(huì),并沒(méi)有實(shí)現(xiàn)技術(shù)的飛躍。

盡管GPT-5表現(xiàn)一般,但是我們充分相信,在全球眾多AI產(chǎn)品快速發(fā)展的進(jìn)程中,下一次驚艷眾人的世界級(jí)AI大模型,不久的將來(lái)一定會(huì)再次誕生。對(duì)此,我們拭目以待。

作者:劉剛,微信公眾號(hào):產(chǎn)品經(jīng)理之路

本文由作者@劉剛 原創(chuàng)/授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!