AI混戰(zhàn)日:OpenAI開源、Claude發(fā)最強coding模型、Google驚艷的世界模型也亮相

0 評論 386 瀏覽 0 收藏 11 分鐘

8月5日,AI領(lǐng)域迎來了一場震撼的“混戰(zhàn)日”。硅谷的三大模型巨頭——OpenAI、Anthropic和Google——在同一天發(fā)布了各自極具里程碑意義的模型。OpenAI推出了名為GPT-oss的開源模型,這是其繼GPT-2之后的又一重大戰(zhàn)略舉措;Anthropic發(fā)布了Claude 4.1 Opus,進一步鞏固了其在編程助手領(lǐng)域的領(lǐng)先地位;而Google則帶來了Genie 3,一個能夠生成可交互3D世界的“世界模型”。這一天,不僅是技術(shù)的展示,更是AI行業(yè)競爭格局的重塑。本文將帶你深入剖析這三大模型的發(fā)布背后的戰(zhàn)略意義,以及它們?nèi)绾瓮苿覣I技術(shù)走向更復雜和多元的競爭時代。

硅谷最重要的三家模型大廠,同一天發(fā)布了各自非常具有節(jié)點意義的模型。這種混戰(zhàn)日有陣子沒見到了。

8月5日注定會成為AI技術(shù)和商業(yè)競爭格局演變里重要的一個時刻。

同一天,Google先扔出了Genie 3模型——一個你可以和模型生成的3D世界實時交互的世界模型。 接著Anthropic直接更新了它最主力的Claude Opus系列,發(fā)布Claude 4.1 Opus,coding能力繼續(xù)突破。 然后OpenAI預告了許久許久的開源模型,也終于來了。如此前泄露的,OpenAI發(fā)布了名為GPT-oss的,開放權(quán)重的模型。這是它繼GPT-2之后,再度開源它的語言模型。

三個模型發(fā)布在24小時內(nèi)接連發(fā)生,但與過去充滿火藥味的直接競爭不同,這次各家更多是在各自擅長的領(lǐng)域展示著不同的進化方向。AI的敘事,正在從“誰的模型更強”的單一維度,走向更復雜和多元的競爭格局。

OpenAI GPT-oss:遲到的“開源”,精明的卡位

OpenAI終于交出了它的開放權(quán)重模型作業(yè):GPT-oss,一個13B參數(shù)的密集模型。這并非一個能與GPT-4o或Claude 4.1匹敵的SOTA模型,其性能大致對標Llama 3 8B或Qwen2 7B。在一些基準測試上,它的表現(xiàn)甚至略遜于同量級對手。

但它的意義不在于性能,而在于“OpenAI”這個名字和它附帶的許可證。

首先,依然要說,這不是一次徹底的開源。

GPT-oss使用的是OpenAI自定義的“OpenAI Model License 1.0”,其中最關(guān)鍵的條款是,禁止任何年度收入超過1億美元或日活躍用戶超過100萬的商業(yè)實體,使用GPT-oss來開發(fā)或提供與OpenAI核心產(chǎn)品(如API、ChatGPT)競爭的服務。這個“毒丸”條款精準地將所有潛在的大公司競爭對手排除在外,同時又能讓廣大的中小開發(fā)者和研究者進入其生態(tài)。

其次,這是OpenAI自GPT-2以來首次開放權(quán)重,是一次重大的戰(zhàn)略轉(zhuǎn)向。它不再僅僅是那個高高在上的閉源領(lǐng)導者,而是試圖通過一個“夠用”的開放模型,將開發(fā)者吸引到它的生態(tài)系統(tǒng)中——用GPT-oss進行本地開發(fā)、微調(diào),然后無縫遷移到更強大的OpenAI閉源模型上。

回到OpenAI為什么要發(fā)開源模型,一切都源于DeepSeek的沖擊——當一個免費的開源的模型,達到了它閉源收費極高的模型對于它自己的大部分用戶來說所感受到的水準,這是致命打擊。今天的GPT-oss是OpenAI的一種防御,也是它想要做的生態(tài)擴張的動作,對抗DeepSeek、Qwen等開源力量對其開發(fā)者基礎(chǔ)的侵蝕。

Google Genie 3:從生成世界到“玩”世界

GPT-oss更多是商業(yè)策略的產(chǎn)物,Google同日發(fā)布的Genie 3更多帶來的是技術(shù)想象力。

Genie 3被定義為一個已經(jīng)被說爛了的詞——“世界模型”,但它還是更進了一步,不再滿足于生成視頻或3D資產(chǎn),而是直接生成一個可交互的3D世界。

你給它一張圖片、一段文字描述,甚至是一個草圖,Genie 3就能創(chuàng)造出一個風格一致、符合物理邏輯的3D環(huán)境,并且允許你實時地在其中行動和互動。它能理解“向左走”、“跳起來”這類自然語言指令,并即時渲染出對應的第一人稱視角畫面。

這是通過一種名為“時空視頻Transformer”(SVT)的架構(gòu)實現(xiàn)的。Genie 3在超過20萬小時的公開游戲視頻(主要是2D平臺游戲)上進行訓練,學會了理解動作和世界的因果關(guān)系。它不僅能生成世界,還能推斷出世界中不同物體和角色的行為模式。比如讓一個細節(jié)處的樹在不同場景永遠保持一致。

這意味著AI第一次擁有了創(chuàng)造一個可供“玩?!钡奶摂M空間的能力,為游戲開發(fā)、模擬器、機器人訓練乃至元宇宙的實現(xiàn)路徑,提供了一個極具震撼力的雛形。

Google的Genie 3收獲了近乎一致的驚嘆。英偉達的兩位高級研究科學家Jim Fan和Phillip Isola不約而同地表達了震撼。Isola稱其“太瘋狂了”,而Jim Fan則形容這是“一次量子躍遷(quantum leap)”。

這個能從單張圖片中幻想出整個互動游戲世界的AI,通過學習海量視頻內(nèi)化了物理世界的直觀知識,可能正是通往通用機器人的一大步。

Claude 4.1 Opus:程序員的“新神”

Anthropic則繼續(xù)在它最鋒利的“矛”上加碼。新發(fā)布的Claude 4.1 Opus,目標明確——成為最強的編程助手。

根據(jù)官方數(shù)據(jù),在衡量代碼生成、調(diào)試和邏輯推理能力的HumanEval+基準測試上,Claude 4.1 Opus的得分達到了驚人的85.2%,首次超越了此前由GPT-4o創(chuàng)下的84.9%的紀錄。在內(nèi)部的Agentic Coding評估中,它解決問題的能力也比前代提升了近一倍。

除了更強的能力,Claude 4.1還更快、更便宜。對于開發(fā)者和企業(yè)用戶來說,這意味著在實際工作流中,AI coding的效率和性價比都得到了實質(zhì)性提升。Anthropic依然是選擇了一條最務實、離錢最近的道路。這現(xiàn)在已經(jīng)是它的某種護城河了。

這些模型,尤其是OpenAI的開源模型在真實環(huán)境里的表現(xiàn)是接下來行業(yè)關(guān)注的重點。我們也會繼續(xù)實際評測這些模型。而仔細觀察,其實這次的“混戰(zhàn)日”與過往非常不同,三個模型彼此之間并非直接的“互相狙擊”,而更像是湊在一起把注意力放到最大。

這一方面說明,像OpenAI此前喜歡做的、搶在同一時間發(fā)布同類模型來壓制對手的做法,在今天越來越難。GPT-5不再是一個完全能由開發(fā)團隊自己決定訓練完成節(jié)點的模型,而是一個更像實驗的研究,需要等待諸多變量最終成熟。當你的大殺器無法準時就位時,單純靠“實力”來競爭的階段就過去了,策略變得重要,OpenAI用一個策略性的“開源”產(chǎn)品來穩(wěn)固陣地成了必然選擇。

另一方面,其實更重要的是,今天硅谷的重要公司們已經(jīng)開始“分工明確”。

Anthropic的Claude在編程上的能力真的在“遙遙領(lǐng)先”,并且它也從中獲得了好處并且打算把這個優(yōu)勢繼續(xù)鞏固下去;OpenAI則處于前所未有的動蕩期,它投入更多精力來建設一整套生態(tài)系統(tǒng),以維持住其仍然存在但也并不厚的先發(fā)優(yōu)勢,同時寄希望于等待GPT-5的成熟,這一套組合拳下來,穩(wěn)住軍心穩(wěn)住估值把故事講下去;而Google,在核心LLM能力追上第一梯隊后,顯然又開始扮演起“下一個Transformer時刻”的締造者角色。從VEO3到Genie 3,它在投入別人沒法或不愿投入的資源,去賭下一個范式的突破。

模型的進步?jīng)]有停,AI世界更熱鬧了。

作者:Gemini Prompt:王兆洋

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號:【硅星人Pro】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!