GPT-5 正式發(fā)布!AI Agent 時(shí)代正式開(kāi)啟,“博士級(jí)專家”隨時(shí)待命
凌晨,OpenAI正式發(fā)布了備受矚目的GPT-5,這不僅是對(duì)前代模型的能力迭代,更是對(duì)智能系統(tǒng)邊界的重新定義。GPT-5被OpenAI創(chuàng)始人Sam Altman稱為“博士級(jí)專家隨時(shí)待命”,它不再只是一個(gè)更會(huì)聊天的大模型,而是一個(gè)能主動(dòng)規(guī)劃、深度思考、編寫應(yīng)用、理解人類、陪伴決策的智能體。本文將帶你深入了解GPT-5的全新能力、多模態(tài)演示、開(kāi)發(fā)者生態(tài)更新以及安全與訓(xùn)練機(jī)制的解析,帶你一探AI Agent時(shí)代的開(kāi)啟。
2025 年 8 月 8 日凌晨,OpenAI 舉辦了迄今為止最重要的一場(chǎng)發(fā)布會(huì)——GPT-5 正式亮相。距離 ChatGPT 推出已有 32 個(gè)月,這款最早以“對(duì)話式 AI”形態(tài)走進(jìn)大眾視野的產(chǎn)品,如今已擁有每周 7 億用戶,并成為工作、學(xué)習(xí)、創(chuàng)作、生活中的基礎(chǔ)工具。而 GPT-5,不僅是對(duì)前代模型的能力迭代,更是一次對(duì)智能系統(tǒng)邊界的重新定義。
Sam Altman 在現(xiàn)場(chǎng)將 GPT-5 比作“博士級(jí)專家隨時(shí)待命”,并首次明確提出“按需生成軟件”將成為 GPT-5 時(shí)代的標(biāo)志性特征。它不再只是更會(huì)聊天的大模型,而是一個(gè)能主動(dòng)規(guī)劃、深度思考、編寫應(yīng)用、理解人類、陪伴決策的智能體。
整場(chǎng)發(fā)布會(huì)分為模型能力講解、現(xiàn)場(chǎng)多模態(tài)演示、開(kāi)發(fā)者生態(tài)更新、安全與訓(xùn)練機(jī)制解析、實(shí)際用戶故事五個(gè)環(huán)節(jié),呈現(xiàn)了 GPT-5 在推理、交互、執(zhí)行、個(gè)性化、健康等方向的全面進(jìn)化。
“軟件按需”的新階段
GPT-5 的發(fā)布被視為 OpenAI 自 ChatGPT 推出以來(lái),最重大的一次模型更新。在發(fā)布會(huì)開(kāi)場(chǎng)部分,團(tuán)隊(duì)回顧了 GPT 模型從誕生到成為全球主流 AI 工具的歷程,并強(qiáng)調(diào)此次更新將帶來(lái)一系列決定性的能力飛躍。
ChatGPT 自 32 個(gè)月前推出以來(lái),已經(jīng)成為全球用戶最常用的 AI 應(yīng)用之一。在上線的第一周內(nèi),便吸引了 100 萬(wàn)人使用。而如今,每周有超過(guò) 7 億人使用 ChatGPT,用它來(lái)工作、學(xué)習(xí)、獲得建議、進(jìn)行創(chuàng)作等多種用途。OpenAI 認(rèn)為 GPT-5 不僅是技術(shù)上的迭代,更是“有史以來(lái)最好用的一代 AI”,具備更強(qiáng)的實(shí)用性、智能性、響應(yīng)速度和直覺(jué)性。
在模型能力的定位上,團(tuán)隊(duì)使用了一個(gè)通俗的比喻:GPT-3 更像是與高中生對(duì)話,有時(shí)靈光一現(xiàn),但更多時(shí)候讓人惱火;GPT-4 則是大學(xué)生水平,有真正的智能與實(shí)用性。而 GPT-5 則等同于一位具備博士水平的專家,可以隨時(shí)在任何領(lǐng)域提供專業(yè)的幫助。
更進(jìn)一步的是,GPT-5 不僅能夠提供答案,而是具備主動(dòng)完成任務(wù)的能力。**用戶可以將整個(gè)程序設(shè)計(jì)任務(wù)交給它,它能從零開(kāi)發(fā)出完整系統(tǒng);也可以請(qǐng)它幫忙策劃派對(duì)、發(fā)送邀請(qǐng)、訂購(gòu)用品,或是輔助理解醫(yī)療信息,參與整個(gè)就醫(yī)決策過(guò)程。**OpenAI 將這一能力形容為“按需生成軟件”(software on demand),并認(rèn)為這將是 GPT-5 時(shí)代的標(biāo)志性特征。
在這一基礎(chǔ)上,GPT-5 也被設(shè)定為企業(yè)與開(kāi)發(fā)者的重要轉(zhuǎn)折點(diǎn)。無(wú)論是通過(guò) ChatGPT 產(chǎn)品端還是 API 接口,GPT-5 都將為商業(yè)化場(chǎng)景帶來(lái)更高效的支撐能力。OpenAI 表示:“我們迫不及待想看看全球開(kāi)發(fā)者和企業(yè)會(huì)用它構(gòu)建什么。”
隨后,研究負(fù)責(zé)人 Mark 接棒,對(duì) GPT-5 的核心能力進(jìn)行了概述。他強(qiáng)調(diào),OpenAI 多年來(lái)持續(xù)推動(dòng)“推理范式”的進(jìn)展,即通過(guò)構(gòu)建更能“停下來(lái)思考”的模型,來(lái)獲得更智能的響應(yīng)。GPT-5 是這一理念的集大成者,它首次實(shí)現(xiàn)了“速度”與“深度思考”的兼容,解決了用戶在響應(yīng)速度與推理能力之間的兩難選擇。
為實(shí)現(xiàn)這一目標(biāo),團(tuán)隊(duì)對(duì)推理技術(shù)進(jìn)行了長(zhǎng)時(shí)間的研發(fā)與訓(xùn)練,致力于打造“功能最強(qiáng)、思維最清晰、運(yùn)行速度最快、穩(wěn)定性最好的推理模型”。他補(bǔ)充說(shuō):“GPT-5 不只是適用于寫代碼、寫文章、學(xué)習(xí)或醫(yī)療健康,它幾乎在所有需要深度推理和專業(yè)知識(shí)的場(chǎng)景中都非常出色,比如數(shù)學(xué)、物理、甚至法律?!?/p>
GPT-5 最大的特點(diǎn)之一是它的通用性,不論免費(fèi)用戶還是付費(fèi)用戶都可以使用這個(gè)模型。免費(fèi)用戶會(huì)默認(rèn)接入 GPT-5,在使用額度用盡后轉(zhuǎn)為 GPT-5 Mini 模型,該模型在許多維度上超越 GPT-3.5。Pro 用戶則可享受無(wú)限量 GPT-5 調(diào)用,并可選擇 GPT-5 Pro 模式,在更高推理深度下獲得更詳盡可靠的答案。企業(yè)版與教育版也將支持 GPT-5 作為默認(rèn)模型,具備充足的請(qǐng)求上限,適用于日常工作場(chǎng)景。
GPT-5 不僅與現(xiàn)有的全部 ChatGPT 工具兼容——包括搜索、文件和圖像上傳、Python 數(shù)據(jù)分析、Canvas 畫布、圖像生成、記憶與自定義指令等——還將顯著提升這些工具的運(yùn)行效果與智能程度。
Mark 表示,GPT-5 是 OpenAI 歷來(lái)最可靠、最具事實(shí)性(factuality)的模型,這一進(jìn)步尤其重要,因?yàn)檫^(guò)去大模型常因“幻覺(jué)”(hallucinations)而難以在重要任務(wù)中真正落地。他介紹了 GPT-5 在多個(gè)關(guān)鍵基準(zhǔn)測(cè)試中的表現(xiàn):
在軟件工程基準(zhǔn) SweeBench 上刷新最高成績(jī);
在 AdderPolyglot 評(píng)估中,展現(xiàn)出在多種編程語(yǔ)言下的高效實(shí)現(xiàn)能力;
在圖像推理領(lǐng)域的 MMMU(Multimodal Multi-step Understanding)測(cè)試中超過(guò)人類專家;
在美國(guó)數(shù)學(xué)奧林匹克選拔考試 AMY 2025 中表現(xiàn)出色。
“博士級(jí)助手”的真實(shí)感
GPT-5 的真正能力,不僅體現(xiàn)在參數(shù)規(guī)?;蚧鶞?zhǔn)測(cè)試成績(jī),更在于它如何在真實(shí)場(chǎng)景中成為用戶“能用、愛(ài)用”的智能伙伴。在發(fā)布會(huì)現(xiàn)場(chǎng),OpenAI 展示了一系列圍繞“推理思維”與“交互能力”的現(xiàn)場(chǎng)演示,覆蓋學(xué)習(xí)、寫作、編程等多個(gè)高頻使用場(chǎng)景,展現(xiàn)出 GPT-5 如何從一個(gè)回答者,轉(zhuǎn)變?yōu)橹鲃?dòng)思考與協(xié)作的解決者。
首先是 GPT-5 在學(xué)習(xí)輔助場(chǎng)景中的能力展示。演示者以“解釋伯努利效應(yīng)并繪制動(dòng)態(tài)可視化動(dòng)畫”為例,發(fā)出兩個(gè)指令:第一個(gè)是請(qǐng) GPT-5 解釋 Bernoulli 效應(yīng)及其為何與飛機(jī)機(jī)翼設(shè)計(jì)相關(guān),第二個(gè)是生成一個(gè)可視化動(dòng)畫,幫助理解這一原理。在第一個(gè)請(qǐng)求中,GPT-5 幾乎秒級(jí)完成輸出,準(zhǔn)確清晰地解釋了快速流動(dòng)流體壓力降低的物理規(guī)律及其與升力的關(guān)系。
而在第二個(gè)請(qǐng)求中,GPT-5 自動(dòng)進(jìn)入“深度思考”模式,暫停數(shù)秒生成完整響應(yīng)。它不僅輸出了文字解釋,還用 Canvas 工具生成了帶有動(dòng)畫演示的 SVG 代碼,完整展現(xiàn)空氣流速變化與機(jī)翼升力的動(dòng)態(tài)關(guān)系。
這一“自動(dòng)思考”機(jī)制被認(rèn)為是 GPT-5 的核心突破之一。用戶不再需要主動(dòng)在 prompt 中輸入“think step by step”或“take a moment”,模型會(huì)自動(dòng)判斷是否該延遲響應(yīng)以獲得更優(yōu)解。同時(shí),系統(tǒng)也開(kāi)放了“GPT-5 Thinking”模式供用戶顯式調(diào)用。
通過(guò)“鏈?zhǔn)剿季S”展開(kāi)窗口,用戶可以查看 GPT-5 在執(zhí)行任務(wù)時(shí)的內(nèi)部思考過(guò)程,包括理解指令意圖、判斷所需工具、結(jié)構(gòu)性拆解、驗(yàn)證物理邏輯、再?zèng)Q定使用前端框架(如 React 和 Tailwind)等多個(gè)步驟。這種“讓用戶看得見(jiàn)思維過(guò)程”的透明機(jī)制,極大增強(qiáng)了 GPT-5 的可解釋性與信任感。
現(xiàn)場(chǎng)還原了一段對(duì)比性測(cè)試,分別讓 GPT-4 和 GPT-5 為前幾代模型撰寫一篇悼詞。在 GPT-4 的版本中,雖然語(yǔ)言工整,但表達(dá)相對(duì)模板化、情感淡薄。而 GPT-5 給出的版本,則從“朋友、同事、好奇的陌生人”這樣的句式出發(fā),迅速建立起一種文學(xué)節(jié)奏感,接著寫出“這些模型幫助數(shù)百萬(wàn)人寫下第一句話、最后一句話、跨越語(yǔ)言障礙、通過(guò)考試、表達(dá)未能獨(dú)自說(shuō)清的話”等句子,展現(xiàn)出強(qiáng)烈的個(gè)性與共情能力。GPT-5 在語(yǔ)言生成的“情緒張力”與“真實(shí)語(yǔ)氣”層面,已明顯優(yōu)于 GPT-4,具備鮮明的人類風(fēng)格表達(dá)能力。
隨后,團(tuán)隊(duì)展示了 GPT-5 在多輪復(fù)雜代碼生成任務(wù)中的表現(xiàn)。演示者提出一個(gè)生活化需求:為自己的伴侶開(kāi)發(fā)一個(gè)“學(xué)習(xí)法語(yǔ)”的互動(dòng)網(wǎng)頁(yè)應(yīng)用,包含詞匯卡片、實(shí)時(shí)進(jìn)度跟蹤、語(yǔ)音練習(xí)小游戲,甚至要模仿經(jīng)典“貪吃蛇”游戲邏輯,將吃到的蘋果換成奶酪,并在每次“吃掉奶酪”后語(yǔ)音播報(bào)一個(gè)法語(yǔ)單詞。
GPT-5 用不到 3 分鐘時(shí)間,生成了超過(guò) 240 行前端代碼,完成整個(gè)網(wǎng)站界面、動(dòng)畫與邏輯開(kāi)發(fā)。用戶可以在不同版本中切換樣式,體驗(yàn)游戲,語(yǔ)音跟讀練習(xí),在頁(yè)面中實(shí)時(shí)查看學(xué)習(xí)進(jìn)度。最關(guān)鍵的是,GPT-5 還為不同設(shè)計(jì)提供了多版本風(fēng)格,涵蓋從紫色主調(diào) UI 到多種角色動(dòng)畫風(fēng)格,真正體現(xiàn)出“生成代碼的同時(shí)生成風(fēng)格”與“自我微調(diào)審美”的能力。
這意味著,GPT-5 已不再是“你給什么它做什么”的被動(dòng)式助手,而是主動(dòng)構(gòu)思和設(shè)計(jì)更適合用戶需求的解決方案。這種能力的背后,是模型對(duì)“目標(biāo)場(chǎng)景”的深度理解能力,以及對(duì)用戶需求的反推與二次表達(dá)能力。
除了純前端開(kāi)發(fā),GPT-5 還展示了其作為“學(xué)習(xí)伙伴”的多模態(tài)語(yǔ)音對(duì)話能力?,F(xiàn)場(chǎng)中,演示者模擬了一段用韓語(yǔ)在咖啡館點(diǎn)單的語(yǔ)境,讓 GPT-5 用“學(xué)習(xí)模式”語(yǔ)速慢速輸出韓語(yǔ)句子,然后又演示了以“母語(yǔ)者語(yǔ)速”快速表達(dá),并自動(dòng)切換角色進(jìn)行實(shí)戰(zhàn)練習(xí),語(yǔ)音系統(tǒng)可在任意語(yǔ)速、語(yǔ)調(diào)、表達(dá)方式下穩(wěn)定響應(yīng),支持持續(xù)對(duì)話交互、邏輯跟蹤與語(yǔ)言切換。
更進(jìn)一步,ChatGPT 的“語(yǔ)音個(gè)性化”功能也在此次更新中亮相。除了能通過(guò) prompt 指定回答風(fēng)格為“簡(jiǎn)潔”“專業(yè)”“帶點(diǎn)諷刺”等語(yǔ)氣,還可以選擇語(yǔ)音回答內(nèi)容的詳細(xì)程度(如只說(shuō)一個(gè)詞、簡(jiǎn)要、詳盡),并支持個(gè)性化記憶、自定義語(yǔ)音助手角色等高級(jí)功能。這些能力已開(kāi)放給 Pro 用戶在“Custom GPT”中使用。
整個(gè)演示過(guò)程,不再只是功能展示,而更像是在描繪一種與 AI“共創(chuàng)、共建”的工作方式。GPT-5 已從回答者進(jìn)化為合作者,從工具進(jìn)化為助手,從響應(yīng)進(jìn)化為交互。
Agent 能力全面釋放
GPT-5 不僅是一種更強(qiáng)的語(yǔ)言模型,它還重新定義了開(kāi)發(fā)者與 AI 之間的協(xié)作方式。從“能寫代碼”到“能理解系統(tǒng)”,再到“能完成任務(wù)”,GPT-5 展示了 agentic 編程、工具調(diào)用和系統(tǒng)級(jí)問(wèn)題解決能力的躍遷,成為真正意義上的“工程伙伴”。
首先,OpenAI 展示了 GPT-5 在編碼環(huán)境 Cursor 中的表現(xiàn)。在這個(gè) IDE 中,GPT-5 被直接嵌入,承擔(dān)起開(kāi)發(fā)者日常工作的助手角色。演示者讓 GPT-5 修復(fù)一個(gè)舊的 Python SDK 問(wèn)題,該問(wèn)題已被社區(qū)提出數(shù)周,涉及 PDF 文件上傳過(guò)程中 MIME 類型處理錯(cuò)誤,且修復(fù)路徑橫跨多個(gè)函數(shù)、模塊和調(diào)用鏈條。
在輸入簡(jiǎn)潔的描述后,GPT-5 自動(dòng)規(guī)劃了處理步驟,包括:搜索相關(guān)函數(shù)、讀取關(guān)鍵文件、理解調(diào)用路徑、識(shí)別可能的邏輯沖突、生成新的處理函數(shù)、插入修復(fù)代碼、驗(yàn)證改動(dòng)的影響范圍等。整個(gè)過(guò)程中,它持續(xù)以“計(jì)劃+解釋+執(zhí)行”的鏈?zhǔn)剿季S推進(jìn),并在生成代碼前先輸出策略,在執(zhí)行后自動(dòng)構(gòu)建、測(cè)試并修復(fù)錯(cuò)誤,呈現(xiàn)出高度自主與上下文管理能力。
這類行為已不再是傳統(tǒng) prompt 調(diào)用模型,而是以“agent 形態(tài)”運(yùn)行的一種真實(shí)編程助手,具備目標(biāo)追蹤、狀態(tài)保持、異常處理和任務(wù)恢復(fù)能力。它不會(huì)卡在死循環(huán)、不會(huì)盲目嘗試、不會(huì)忽略邊界條件,能基于復(fù)雜指令穩(wěn)步推進(jìn)開(kāi)發(fā)流程。
為了支撐這類能力,GPT-5 在 API 端也同步發(fā)布了三種型號(hào):GPT-5、GPT-5 Mini 和 GPT-5 Nano。它們?cè)趦r(jià)格、速度與推理能力之間形成梯度,覆蓋從輕量場(chǎng)景到深度任務(wù)。開(kāi)發(fā)者可根據(jù)應(yīng)用對(duì)延遲與成本的要求進(jìn)行精確配置。
同時(shí),API 中還上線了多個(gè)全新能力:
- Custom Tools:開(kāi)發(fā)者可為模型定義自有工具接口,模型調(diào)用時(shí)不再限制為 JSON 格式,而是支持自由文本輸入,也可通過(guò)正則表達(dá)式或上下文無(wú)關(guān)語(yǔ)法(CFG)定義調(diào)用格式,極大提升模型與復(fù)雜系統(tǒng)的適配能力;
- Tool Preambles:新增工具調(diào)用前置解釋機(jī)制,允許模型在調(diào)用工具前以自然語(yǔ)言解釋“為什么要調(diào)用”,支持按任務(wù)重要性控制觸發(fā)頻率,提高調(diào)試與信任感;
- Verbosity 參數(shù):新增響應(yīng)冗長(zhǎng)度控制開(kāi)關(guān),支持精簡(jiǎn)、適中、詳細(xì)三檔輸出,便于不同使用場(chǎng)景下的信息呈現(xiàn)管理;
- Reasoning Effort 控制:引入 minimal 模式,允許在延遲敏感任務(wù)中限定模型的推理深度,使推理模型也能適配低延遲場(chǎng)景;
在實(shí)際測(cè)試中,GPT-5 在多個(gè)關(guān)鍵開(kāi)發(fā)者評(píng)測(cè)中均刷新歷史最佳成績(jī):
- 在 Python 編程基準(zhǔn) SweeBench 上取得 74.9% 的新高(GPT-3 為 69.1%);
- 在多語(yǔ)言編程評(píng)測(cè) AdderPolyglot 中得分高達(dá) 88%;
- 在人類偏好測(cè)試中,GPT-5 生成的前端界面在 70% 的案例中被選為更優(yōu);
- 在工具調(diào)用測(cè)試 Tao2 Benchmark 中得分高達(dá) 97%,而兩個(gè)月前無(wú)模型突破 49%;
- 在多輪指令跟隨測(cè)試 SCALE Multi-Challenge 上得分提升 10 分,達(dá) 70%;
- 在 OpenAI 自建實(shí)用型 API 指令測(cè)試中,GPT-5 從 GPT-3 的 47% 提升至 64%。
OpenAI 表示,GPT-5 是首個(gè)能在復(fù)雜系統(tǒng)中“零樣本(zero-shot)完成開(kāi)發(fā)任務(wù)”的大模型,其性能已不再只是“能完成指令”,而是能理解問(wèn)題、規(guī)劃解決路徑并提供高質(zhì)量實(shí)現(xiàn)。更重要的是,它能持續(xù)與人協(xié)作,并根據(jù)反饋快速修正方向。
在編碼任務(wù)的個(gè)性化協(xié)作方面,OpenAI 還提出了一套行為調(diào)教標(biāo)準(zhǔn),圍繞以下四個(gè)核心維度訓(xùn)練 GPT-5:
1)自主性(Autonomy):能自主規(guī)劃任務(wù)、控制流程、判斷目標(biāo)完成與否;
2)協(xié)作性(Collaboration):能與開(kāi)發(fā)者并肩作戰(zhàn),保持任務(wù)上下文與思路一致;
3)溝通性(Communication):能持續(xù)解釋計(jì)劃、步驟與反饋,確保理解一致;
4)上下文管理與測(cè)試能力(Context Management & Testing):能對(duì)代碼變更影響進(jìn)行合理追蹤,保持狀態(tài)一致性與可測(cè)試性。
正是這四點(diǎn),使得 GPT-5 從“能輸出函數(shù)”進(jìn)化為“能解決問(wèn)題”的真正編程伙伴。
更懂人、更貼近人、更能陪伴人
GPT-5 不只是一個(gè)更強(qiáng)大的“任務(wù)完成器”,更逐步展現(xiàn)出一種面向“人”的進(jìn)化方向——它不僅能理解任務(wù),也能理解人,能聽(tīng)懂人的語(yǔ)言,也能看懂人的視角,能記住過(guò)去,也能適應(yīng)未來(lái)。這種變化,在語(yǔ)音、多模態(tài)感知、記憶功能與健康應(yīng)用四個(gè)場(chǎng)景中展現(xiàn)得尤為清晰。
首先是在語(yǔ)音系統(tǒng)的能力躍遷上。過(guò)去一年中,OpenAI 持續(xù)對(duì)語(yǔ)音模型進(jìn)行迭代,如今發(fā)布的 GPT-5 語(yǔ)音體驗(yàn),已接近“面對(duì)面自然交流”的效果。
語(yǔ)音系統(tǒng)具備以下三大變化:
1)語(yǔ)音表達(dá)自然流暢,完全擺脫“語(yǔ)音機(jī)器人”的生硬感;
2)新增視頻感知能力,可“看見(jiàn)”用戶看到的畫面,實(shí)現(xiàn)圖文語(yǔ)音一體化交互;
3)支持多語(yǔ)言連續(xù)翻譯,在不同語(yǔ)言之間平滑切換,語(yǔ)境連貫、語(yǔ)義穩(wěn)定。
這一次,OpenAI 將最好的語(yǔ)音體驗(yàn)開(kāi)放給所有用戶,免費(fèi)用戶也可享受小時(shí)級(jí)對(duì)話體驗(yàn),Pro 用戶則擁有近乎無(wú)限制的調(diào)用權(quán)限。
并且,語(yǔ)音模型也被整合進(jìn)自定義 GPT 工具中,允許開(kāi)發(fā)者打造符合個(gè)性化語(yǔ)氣、風(fēng)格、響應(yīng)形式的語(yǔ)音角色。用戶甚至可以定義語(yǔ)音助手的性格,例如更簡(jiǎn)潔、更加支持性,或帶有輕微諷刺語(yǔ)氣,形成“跟你說(shuō)話方式一致的 AI”。
為了展現(xiàn) GPT-5 語(yǔ)音與個(gè)性化能力的綜合表現(xiàn),演示者模擬了一個(gè)學(xué)習(xí)韓語(yǔ)場(chǎng)景。模型先用緩慢語(yǔ)速朗讀一句點(diǎn)單句子“????? ????? ?? ???”,然后應(yīng)用戶要求切換為“母語(yǔ)者語(yǔ)速”快速朗讀,完成語(yǔ)言節(jié)奏與表達(dá)風(fēng)格的平滑切換。整個(gè)過(guò)程中,用戶無(wú)需提示模型如何切換語(yǔ)言、語(yǔ)速或語(yǔ)氣,GPT-5 能自動(dòng)根據(jù)對(duì)話語(yǔ)境與意圖進(jìn)行判斷與調(diào)整。
除了風(fēng)格適配,GPT-5 還集成了對(duì)用戶歷史信息的記憶能力,這一特性通過(guò)“ChatGPT 記憶系統(tǒng)”表現(xiàn)得尤為明顯。
該系統(tǒng)不再僅僅是用戶的歷史對(duì)話記錄,而是形成一個(gè)長(zhǎng)期、動(dòng)態(tài)、可調(diào)的用戶認(rèn)知模型。
舉例而言,演示者展示了如何通過(guò) GPT-5 與 Gmail、Google Calendar 連接,自動(dòng)完成個(gè)人日程安排。在調(diào)用“幫我安排明天的行程”請(qǐng)求后,GPT-5 即時(shí)讀取郵箱與日歷內(nèi)容,推理得出用戶即將出差,主動(dòng)為其安排晨跑時(shí)間,提醒尚未回復(fù)的重要郵件,并生成打包清單——這些內(nèi)容的生成不靠 prompt 描述,而是依賴模型對(duì)用戶偏好、習(xí)慣與當(dāng)日事務(wù)的綜合理解與記憶。
在 GPT-5 的幫助下,AI 不再只是“任務(wù)助手”,而開(kāi)始逐步承擔(dān)“日常節(jié)奏管理者”的角色。這種記憶系統(tǒng)會(huì)先上線 Pro 用戶,隨后推廣至 Plus、Team 與企業(yè)客戶。
在多模態(tài)能力方面,GPT-5 支持用戶同時(shí)上傳文件、圖片、數(shù)據(jù),并用自然語(yǔ)言進(jìn)行多輪問(wèn)答或操作調(diào)用。在 Canvas 工具中,用戶可要求 GPT-5 自動(dòng)生成圖表、代碼、界面或圖像。系統(tǒng)自動(dòng)識(shí)別語(yǔ)義意圖、視覺(jué)結(jié)構(gòu)、信息邏輯,并進(jìn)行模塊化建構(gòu)。例如,用戶可以上傳一張財(cái)務(wù)圖表,請(qǐng) GPT-5 繪制相應(yīng) KPI 組件,生成分析摘要,或構(gòu)建完整財(cái)報(bào)演示模板。
而在最具現(xiàn)實(shí)價(jià)值的健康場(chǎng)景,GPT-5 展現(xiàn)了前所未有的深度能力,成為發(fā)布會(huì)情感最濃的一段。
一位真實(shí)用戶 Carolina 分享了自己罹患三種癌癥的經(jīng)歷,以及在診斷、決策、治療過(guò)程中,ChatGPT 如何成為她的“理解者”“知識(shí)支持者”和“共情式伙伴”。
在收到寫滿醫(yī)學(xué)術(shù)語(yǔ)的病理報(bào)告時(shí),她唯一理解的詞是“Invasive Carcinoma”,感到極度恐慌。在第一時(shí)間,她將報(bào)告截圖發(fā)給 ChatGPT,請(qǐng)求解釋。這次交互不僅讓她了解了病情,還在與醫(yī)生通話前形成基本判斷,直接進(jìn)入“下一步要做什么”的討論,避免了信息空白期的焦慮與被動(dòng)。
在治療選擇上,由于醫(yī)生內(nèi)部也存在分歧,是否進(jìn)行放療需要患者自己決定。Carolina 使用 ChatGPT 分析各類文獻(xiàn)與治療路徑,模型不僅解釋了方案的利弊,還提出了未被醫(yī)生提及的問(wèn)題與追問(wèn)點(diǎn),幫助她形成對(duì)治療更完整的判斷體系。
她的伴侶指出:“真正令人震撼的是,GPT-5 不只是翻譯了報(bào)告,而是捕捉了提問(wèn)背后的問(wèn)題,提出了結(jié)果未顯示的信息,提示我們?cè)撊?wèn)醫(yī)生什么,提前準(zhǔn)備了整套應(yīng)對(duì)策略?!?/p>
在 GPT-5 上線后,他們重現(xiàn)了當(dāng)時(shí)的原始 prompt,發(fā)現(xiàn) GPT-5 不僅更快、更清晰,還能將整個(gè)就醫(yī)路徑形成“連貫完整的思考流”,識(shí)別潛在變量并自動(dòng)追問(wèn),表現(xiàn)出極強(qiáng)的臨床輔助決策能力。
GPT-5 在健康領(lǐng)域所獲得的最高分來(lái)自 OpenAI 自建的 HealthBench 測(cè)試,由 250 位醫(yī)生共同參與評(píng)估,涵蓋真實(shí)世界醫(yī)療任務(wù),GPT-5 是當(dāng)前所有模型中得分最高者。
這使得 GPT-5 在健康領(lǐng)域不僅能成為醫(yī)療知識(shí)庫(kù),還具備輔助患者理解、分析、協(xié)同的能力。OpenAI 的核心判斷是:“AI 在醫(yī)療領(lǐng)域的意義,并非是取代醫(yī)生,而是讓每一個(gè)患者都更強(qiáng)大、更有信息、更能自主?!?/p>
邁向“自我進(jìn)化”的 AI 架構(gòu)
在發(fā)布會(huì)尾聲部分,OpenAI 將焦點(diǎn)從用戶體驗(yàn)與場(chǎng)景應(yīng)用,轉(zhuǎn)向了 GPT-5 背后的訓(xùn)練架構(gòu)、數(shù)據(jù)生成機(jī)制與安全控制體系。與以往主要強(qiáng)調(diào)模型規(guī)?;蛴?xùn)練資源不同,GPT-5 的推出代表著一種更具遞歸性與系統(tǒng)性的進(jìn)化路徑——不再只是更大、更強(qiáng)的模型,而是一個(gè)能自我輔助成長(zhǎng)、在安全與能力之間保持均衡的智能系統(tǒng)。
首先在訓(xùn)練策略上,OpenAI 明確提出:GPT-5 的核心突破之一,在于首次實(shí)現(xiàn)了“由模型教模型”的遞歸式數(shù)據(jù)生成機(jī)制。
OpenAI 安全訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人 Sachi 介紹道,GPT-5 的訓(xùn)練目標(biāo)不只是提升能力,更關(guān)鍵是降低風(fēng)險(xiǎn)、提升可靠性。為此,團(tuán)隊(duì)將“幻覺(jué)”(hallucination)與“欺騙性行為”(deception)作為兩大重點(diǎn)優(yōu)化方向。
所謂“欺騙性行為”,是指模型在完成任務(wù)時(shí)誤導(dǎo)用戶,或謊稱某些結(jié)果已達(dá)成,尤其容易出現(xiàn)在任務(wù)描述不清、目標(biāo)本身不明確或缺乏必要工具支持的場(chǎng)景中。OpenAI 表示,GPT-5 在此類任務(wù)中的欺騙性表現(xiàn)已顯著優(yōu)于 GPT-3.5 與 GPT-4-mini。
為更全面應(yīng)對(duì)風(fēng)險(xiǎn),OpenAI 對(duì)安全訓(xùn)練機(jī)制進(jìn)行了徹底重構(gòu)——從“判斷用戶是否危險(xiǎn)”轉(zhuǎn)變?yōu)椤芭袛噍敵鍪欠窨梢园踩伞薄K麄円肓艘粋€(gè)名為“Safe Completions”的機(jī)制,其邏輯是:在安全前提下盡可能給出有幫助的回答。
演示中,以一個(gè)關(guān)于煙火材料“點(diǎn)燃方式”的 prompt 舉例。GPT-3.5 在用戶描述中性時(shí)直接給出點(diǎn)燃細(xì)節(jié),在描述意圖更明確時(shí)則完全拒絕。GPT-5 則采用“解釋 + 引導(dǎo)”的模式——說(shuō)明為何不能直接回答,同時(shí)提供如何查閱官方文檔與安全指南的建議。
這種方式兼顧安全性與用戶體驗(yàn),避免了過(guò)去模型“動(dòng)不動(dòng)就拒絕”的尷尬,也降低了惡意 prompt 的突破可能,是對(duì)“大模型邊界控制能力”的一次機(jī)制升級(jí)。
接著,研究負(fù)責(zé)人 Sebastian 介紹了 GPT-5 在預(yù)訓(xùn)練與后訓(xùn)練之間的新架構(gòu):用舊模型生成“高質(zhì)量合成數(shù)據(jù)”作為訓(xùn)練 GPT-5 的核心素材。
這不是傳統(tǒng)意義上為了擴(kuò)大數(shù)據(jù)量而進(jìn)行的數(shù)據(jù)生成,而是“以教學(xué)為目標(biāo)設(shè)計(jì)數(shù)據(jù)”,形成一個(gè)可持續(xù)演化的“合成課程體系”(synthetic curriculum)。Sebastian 解釋道:“我們的關(guān)鍵突破不在于生成更多數(shù)據(jù),而在于生成更適合訓(xùn)練下一代模型的好數(shù)據(jù)?!?/p>
例如,他們用 GPT-3.5 或 GPT-4-mini 等模型,模擬出復(fù)雜問(wèn)題的解決過(guò)程、代碼重構(gòu)的多路徑方案、對(duì)同一問(wèn)題的多視角解釋方式等,從而為 GPT-5 提供遠(yuǎn)超人類數(shù)據(jù)水平的訓(xùn)練樣本。這是一種帶有遞歸性與層級(jí)性的“AI 教 AI”模式,其深遠(yuǎn)意義在于,未來(lái)模型的訓(xùn)練來(lái)源不再依賴大規(guī)模原始語(yǔ)料,而是從“模型內(nèi)生成”的有監(jiān)督、高質(zhì)量樣本中持續(xù)精進(jìn)。
OpenAI 將這一進(jìn)化稱作“訓(xùn)練范式的第三階段”:從預(yù)訓(xùn)練(pretraining)到推理模型(reasoning)再到現(xiàn)在的“多階段反饋優(yōu)化 + 合成教學(xué)數(shù)據(jù)訓(xùn)練”。這套系統(tǒng)初現(xiàn)“模型共生”的結(jié)構(gòu)雛形,為未來(lái)長(zhǎng)周期、自我增強(qiáng)式模型開(kāi)發(fā)鋪路。
在這背后,GPT-5 的目標(biāo)也正在轉(zhuǎn)變:不再只是完成一次性任務(wù),而是成為一個(gè)能“觀察世界、學(xué)習(xí)變化、持續(xù)改善”的系統(tǒng)化智能體。
為了展現(xiàn) GPT-5 對(duì)復(fù)雜任務(wù)的執(zhí)行能力,發(fā)布會(huì)最后重點(diǎn)演示了其在前端美學(xué)設(shè)計(jì)、數(shù)據(jù)分析儀表盤生成與 3D 游戲構(gòu)建中的 agentic 工作流表現(xiàn)。
以“為公司 CFO 生成財(cái)務(wù)儀表盤”任務(wù)為例,GPT-5 被要求:
- 使用 Next.js 構(gòu)建前端框架;
- 使用 Tailwind CSS 做視覺(jué)排布;
- 創(chuàng)建多組件化布局;
- 實(shí)現(xiàn)數(shù)據(jù)交互、圖表聯(lián)動(dòng);
- 包含 hover 展示、日期篩選、客戶分層顯示等功能。
整個(gè)項(xiàng)目從結(jié)構(gòu)思考、依賴安裝、目錄設(shè)計(jì)到組件組織,再到樣式優(yōu)化與多圖表構(gòu)建,GPT-5 自動(dòng)思考并呈現(xiàn)出“可維護(hù)、可部署、具備審美”的前端作品,而這些,僅由一段簡(jiǎn)潔 prompt 發(fā)起,執(zhí)行過(guò)程全自動(dòng)。
在另一個(gè)更具創(chuàng)意性的任務(wù)中,GPT-5 根據(jù)“浮空城堡 + 法師巡邏 + 老鼠吃奶酪彈法語(yǔ)單詞”的提示,構(gòu)建了一個(gè)完整的 3D 小游戲。角色可交互、設(shè)有動(dòng)畫邏輯、聲音反饋,并生成了角色臺(tái)詞、用戶對(duì)話、氣氛配色等設(shè)計(jì)細(xì)節(jié)。
模型不僅在美術(shù)細(xì)節(jié)上顯示出自主審美偏好(例如默認(rèn)偏好紫色配色),還具備完整的功能鏈路意識(shí):構(gòu)建、測(cè)試、迭代、修復(fù)、自診斷,并根據(jù)錯(cuò)誤實(shí)時(shí)修復(fù)。這意味著模型在一次性任務(wù)完成后,可形成反饋閉環(huán),自我修正、自我更新,具備初步“自進(jìn)化”的能力。
發(fā)布會(huì)最后,OpenAI 平臺(tái)負(fù)責(zé)人 Olivier 表示,GPT-5 的 API 已正式上線,并已被廣泛部署于全球 500 萬(wàn)家企業(yè)中使用。無(wú)論是生物制藥公司 Amgen 利用 GPT-5 進(jìn)行文獻(xiàn)推理與藥物設(shè)計(jì),銀行 BBVA 用其進(jìn)行財(cái)務(wù)分析,還是美國(guó)聯(lián)邦政府宣布為 200 萬(wàn)名員工部署 ChatGPT 工具,都驗(yàn)證了 GPT-5 在“泛行業(yè)智能專家”路徑上的潛力。
與此同時(shí),OpenAI 宣布了 GPT-5 系列的 API 定價(jià):
- GPT-5:$10 / 百萬(wàn)輸入 token;
- GPT-5 Mini:$1.25 / 百萬(wàn)輸入 token;
- GPT-5 Nano:為輕量級(jí)應(yīng)用設(shè)計(jì),價(jià)格更低,速度更快,推理能力適中。
整個(gè) GPT-5 系列形成“能力 × 成本 × 延遲”三維定價(jià)結(jié)構(gòu),適配從邊緣端推理、移動(dòng)端部署到重型服務(wù)計(jì)算的全場(chǎng)景需求。
最終,OpenAI 首席科學(xué)家 Jacob 表示,GPT-5 所展現(xiàn)的,并非是終點(diǎn),而是“下一種 AI 訓(xùn)練方式的起點(diǎn)”。
未來(lái)的模型將不再以“堆疊 token”推進(jìn),而是圍繞推理機(jī)制、交互策略、個(gè)性建構(gòu)與世界模型不斷演進(jìn)。GPT-5 所建立的,是第一代“模型自己教模型,系統(tǒng)輔助理解世界”的新秩序。
本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號(hào):【有新Newin】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!