OpenAI再強(qiáng),也擋不住Google往生態(tài)里狂塞AI

0 評論 400 瀏覽 0 收藏 17 分鐘

在 5 月 21 日的 Google I/O 2025 大會上,谷歌展示了其 AI 領(lǐng)域的顯著進(jìn)展。谷歌改變技術(shù)商業(yè)化節(jié)奏,將 AI 深度融入其生態(tài),不僅在 Gemini 系列模型上取得突破,還將其 AI 能力廣泛應(yīng)用于搜索、廣告、云和設(shè)備等眾多產(chǎn)品中,展現(xiàn)出獨(dú)特的打法和競爭力。

5 月 21 日凌晨,Google I/O 2025 大會正式舉辦。

與一兩年前相比,谷歌的 AI 進(jìn)展顯著加快,Gemini 2.5 此次也有較大更新。

但這些其實都不算重點(diǎn),畢竟 Gemini 2.5 Pro 有多厲害我們早就見識過,谷歌追趕 OpenAI 也不是一天兩天的事了。

這次更新動作幾乎沒有全新的產(chǎn)品,反而是前幾天發(fā)布的 AlphaEvolve 更具突破性。

但,這樣的谷歌還是會令競爭對手感到害怕,因為它似乎找到了真正適合自己的 AI 打法:不是往 AI 里加生態(tài),而是往生態(tài)里加 AI。這是大部分AI公司不具備的能力,即便是 OpenAI( 或許是也是 OpenAI 這次沒有選擇狙擊谷歌的原因)。

這個道理,就像國內(nèi)的元寶,靠著自己騰訊的生態(tài)位直接把 kimi 打得干脆不投流一樣。

Google I/O 2025 實質(zhì)上是展示了谷歌如何借助生態(tài)廣度將 AI 能力發(fā)揮到極致。過去一年,谷歌幾乎是完全改變了一直以來的技術(shù)商業(yè)化節(jié)奏,AI 戰(zhàn)略變得極為激進(jìn)。

谷歌 CEO Sundar Pichai 在 Google I/O 2025 中表示,“ 在 Gemini 時代,我們很可能會在三月的某個周二發(fā)布我們最智能的模型,或者提前一周宣布像 AlphaEvolve 這樣的酷炫突破。我們的發(fā)布速度比以往任何時候都快。”

對谷歌而言,現(xiàn)在每時每刻都處于緊張的競爭狀態(tài),來看看下圖中展示的谷歌兩年內(nèi)的密集發(fā)布量便能體會。

圖源:Google I/O 2025 Keynote

如今,谷歌的 Gemini 2.5 Pro 在很多方面都領(lǐng)先于各家競爭對手,Gemini 系列模型的 Elo 分?jǐn)?shù)自第一代 Gemini Pro 模型以來已提升了 300 多分,并且它正在不斷向自己的數(shù)十億搜索用戶( 而不只是 4 億 Gemini 月活用戶 )推出新的 AI 功能,這個規(guī)模幾乎無可比擬。

深度思考模式也有進(jìn)一步的增強(qiáng),Gemini 2.5 Pro Deep Think 在數(shù)學(xué)和編程的高難度基準(zhǔn)測試中都拿到了好成績,超越了 OpenAI o3 和 o4-mini 。

圖源:Google 官方 Blog

Gemini 2.5 Flash 則繼續(xù)主打速度和低成本,綜合來看,其成本目前和 DeepSeek R1 大致在同一個水平。

圖源:Google 官方 Blog

Gemini 2.5 在深度思考模式中會展示思維鏈的摘要,新添加了對 MCP 工具的支持,并能控制思考預(yù)算( 該功能將在 Gemini 2.5 Pro Preview 中引入 ),除了沒有展示完整思維鏈還是個槽點(diǎn),也算是當(dāng)前深度思考模型產(chǎn)品的頂配。

因為具有更強(qiáng)的并行性優(yōu)勢,除了圖像、視頻領(lǐng)域,擴(kuò)散模型在語言方向的關(guān)注度也愈發(fā)高漲。谷歌也沒有放過這個增長點(diǎn),推出了 Gemini Diffusion,據(jù)稱其 Demo 版生成速度是谷歌迄今為止最快模型的五倍,編碼能力也沒有縮水。

開發(fā)工具方面幾乎實現(xiàn)了全棧支持,比如 Colab和Gemini Code Assist 用于快速實驗和編碼,Stitch 用于快速設(shè)計前端 UI,F(xiàn)irebase Studio 用于 Web 和移動應(yīng)用開發(fā),Jules 異步處理繁重?zé)o聊的任務(wù)( 比如 debug )等。

可以看出,谷歌早就不再是追趕者,它正走在重奪早期 AI 時代領(lǐng)導(dǎo)地位的路上。

基于強(qiáng)大的基礎(chǔ)模型和早期構(gòu)建起來的應(yīng)用生態(tài),谷歌開始發(fā)揮自己的獨(dú)有優(yōu)勢,其將 AI 集成到如此多產(chǎn)品( 搜索、廣告、云和設(shè)備等 )中的能力幾乎無人能及。相比之下,OpenAI 擁有出色的技術(shù),但可以說只有一款主要產(chǎn)品ChatGPT。

基礎(chǔ)模型拼的是 AI 輸出能力,但要打造好的產(chǎn)品應(yīng)用,好的輸入能力也很重要。

比如主流大模型產(chǎn)品原本普遍不支持直接的 URL 網(wǎng)頁內(nèi)容提取,只能被動地通過搜索功能實現(xiàn)。而谷歌正在實驗的 “ URL 上下文 ” 支持能力,若能大規(guī)模落地,其利用谷歌搜索和互聯(lián)網(wǎng)生態(tài)豐富上下文的能力不可小覷,價值相當(dāng)于公開數(shù)據(jù)中的 MCP。

這其實就是將 AI 嵌入各個環(huán)境以構(gòu)建 AI Agent 的操作,關(guān)鍵在于,谷歌還能通過應(yīng)用生態(tài)將這些 AI Agent 再連接起來。

在搜索的時候順便看一眼 AI 提供的摘要,如今估計已成為了大多數(shù)人的習(xí)慣,谷歌表示,“ 用戶使用 AI 概覽后,對搜索結(jié)果更加滿意,搜索頻率也更高?!?/strong>

以搜索為立命之本的谷歌自然不會放過這一增長點(diǎn),對搜索功能特別進(jìn)行了加強(qiáng),推出了 AI Mode 。

AI Mode 底層采用谷歌的 query fan-out 技術(shù),可以將用戶搜索問題分解為子主題,并同時發(fā)出多個查詢。

深度搜索模式則采用相同的 query fan-out 技術(shù),但能發(fā)起更多搜索,可多達(dá)數(shù)百次,直接對標(biāo) OpenAI Deep Research( 最多進(jìn)行 100 次查詢 )。

不僅如此,它還支持將公共數(shù)據(jù)與私人數(shù)據(jù)( 比如 PDF、圖像等 )結(jié)合,這在模態(tài)上比 OpenAI 目前的 Deep Research 模式更加豐富。甚至很快,你就可以在 Google Drive 和 Gmail 上使用 Deep Research 。

搜索中還支持用攝像頭實時互動( 基于 Project Astra 技術(shù) ),以及更多 Agent 能力引入( 基于 Project Mariner 技術(shù) ),支持比價買票這樣的功能。

AI Mode 還會基于 Gmail 信息、搜索記錄、餐廳預(yù)訂記錄等提供個性化體驗,儼然是要把記憶和個性化推到極致。

可視化圖表這類功能我們也在 Claude 的 Artifacts 中體驗過不少,但只有嵌入到谷歌龐大的互聯(lián)網(wǎng)內(nèi)容生態(tài)中,你才能體會到這小小一步有多實用。

看來,谷歌是要將搜索作為一切的入口。

其推出的 AI Mode 購物模式在商業(yè)化意義上最為激進(jìn),通過和包含 500 億條商品信息的購物圖譜( Shopping Graph )結(jié)合來幫助用戶選購商品,甚至還能結(jié)合 Google Pay 自動支付,圖譜本身能保持時效,每小時更新超過 20 億條。這其中,購物圖譜才是谷歌積累的最大優(yōu)勢,至于試穿體驗,雖然一眼驚艷,但只是多了一步計算而已。

這不僅是要革電商的命,也在革谷歌自己的命。谷歌有想過將搜索如此改造之后,對其基本盤即大量網(wǎng)站的流量可能帶來的負(fù)面影響有多大嗎?

據(jù) MIT 科技評論報道,AI 概覽原本已經(jīng)減少了用戶點(diǎn)擊進(jìn)入原始網(wǎng)站的需求,谷歌母公司 Alphabet 甚至因此在今年2月份受到了在線教育公司 Chegg 的起訴。

谷歌是真的豁出去了。

在生態(tài)整合方面,只有蘋果可以匹敵谷歌。然而蘋果的生成式 AI 功能目前遠(yuǎn)遠(yuǎn)落后,這種對比對于用戶將更加明顯,尤其是在歐盟正在推進(jìn)用戶可以替換掉 iPhone 中的 Siri 變成 Google Assistant 當(dāng)下。

Google 的實時語音接口 Live API 允許用戶控制其語氣、口音和說話風(fēng)格,支持檢測用戶聲音情感,支持主動式的響應(yīng)( 忽略背景對話并知道何時做出回應(yīng) ),這些細(xì)節(jié)都暗示谷歌希望打造的應(yīng)該是完全人性化的系統(tǒng)級 AI 助手,跟誰對標(biāo)很明顯了。

既然都要革搜索的命了,不如也把瀏覽器再改造一番。

谷歌將把 Gemini 嵌入到了 Chrome 瀏覽器中,提供網(wǎng)頁摘要,這還是基操。甚至在未來,Gemini 能跨多個標(biāo)簽頁工作以及自動瀏覽網(wǎng)頁。Browser Use 過去只是個玩具,但 Chrome 不是。

不僅是瀏覽器,谷歌的 AI 將內(nèi)置于人們?nèi)粘J褂玫拇蟛糠制脚_中,從 Chrome 瀏覽器到 Android 手機(jī)再到 Workspace。其生態(tài)系統(tǒng)涵蓋個人生活( 照片、家用設(shè)備)、工作(文檔、Meet)、知識(搜索、YouTube)和娛樂( Android/Play )。這種產(chǎn)品生態(tài)系統(tǒng)創(chuàng)造了協(xié)同效應(yīng),從而放大了人工智能的影響力。

生態(tài)廣度在 Gemini Live 中體現(xiàn)的淋漓盡致。Gemini Live 是跟 AI 實時對話的模式,對話中 AI 可以使用谷歌生態(tài)中的工具幫你完成任務(wù),比如 Google 地圖、日歷、Tasks 和 Keep等,未來還計劃連接更多 Google 生態(tài)工具。而且,它還是免費(fèi)的,支持 Android 和 iOS 用戶,支持?jǐn)z像頭和屏幕共享。

谷歌生態(tài)系統(tǒng)有其兩面性,另一面則是谷歌實現(xiàn) AGI 的布局,畢竟 Google DeepMind 的領(lǐng)軍人,是理想主義的 Demis Hassabis,“ 我們正在將 Gemini 擴(kuò)展為一個世界模型?!?/p>

Gemini 不會僅停留于谷歌生態(tài)系統(tǒng),不會停留于瀏覽器,不會停留于手機(jī),它會走向更大的虛擬世界,以及真實世界。

在這兩點(diǎn)上,谷歌此前就通過 Genie 2 生成可實時交互的 3D 模擬環(huán)境,以及 Veo 系列視頻生成模型在直覺物理上更突出,進(jìn)行了初步展現(xiàn)。此外,Gemini 模型目前已經(jīng)能夠響應(yīng)文本、圖像、音頻和視頻。Gemini Robotics 還基于此增加了對物理空間進(jìn)行推理的能力,使機(jī)器人能夠與現(xiàn)實世界交互。

走向更大的虛擬世界,以可嵌入智能眼鏡中的 Android XR 技術(shù)為代表。目前對于搭載 Android XR 的眼鏡,谷歌已經(jīng)演示了向好友發(fā)送消息、預(yù)約、查詢路線、拍照以及兩人對話的實時語言翻譯字幕等場景。

進(jìn)入世界不會限于日常生活,谷歌已經(jīng)接連通過AI在量子計算( AlphaQubit )、數(shù)學(xué)( AlphaProof 和 AlphaGeometry 2 )、生命科學(xué)( AlphaProteo )和算法發(fā)現(xiàn)( AlphaEvolve )領(lǐng)域取得了重磅的成果。

相比之下,Veo 2 的視頻控制和編輯能力( 比如參考生成、運(yùn)鏡控制、局部編輯、擴(kuò)展等 ),Veo 3的音效和對話生成能力,F(xiàn)low 的電影制作能力,這些東西與其它平臺其實別無二致,對谷歌而言,或許只是由于視頻生成工具當(dāng)前效率低下而尚未能整合進(jìn)生態(tài)的臨時模式。

未來,我們很可能會看到一種加速融合的局面,所有大型科技公司都會在每條產(chǎn)品線上應(yīng)用人工智能。競爭不再在于擁有人工智能,而在于誰的人工智能集成度更高、能為用戶帶來更多價值。

而像谷歌這樣的巨頭將先進(jìn)的 AI 技術(shù)捆綁到其無處不在的服務(wù)中時,初創(chuàng)公司在通用 AI 助手或基本功能方面展開競爭可能會很尷尬。

訓(xùn)練并運(yùn)行大型模型的成本高昂,但谷歌可以通過其眾多收入來源( 搜索廣告、云合同等 )以及現(xiàn)在甚至直接訂閱來抵消這筆成本。芯片到數(shù)據(jù)中心的垂直整合能力也意味著谷歌能夠比許多競爭對手更快、更經(jīng)濟(jì)地訓(xùn)練更大的模型。

谷歌正式推出了第七代 TPU Ironwood,性能是上一代的 10 倍,每個 Pod 的計算能力高達(dá) 42.5 exaflops,是全球最大超級計算機(jī) El Capitan 的 24 倍以上,Google Cloud 上的 Pathways 還支持將數(shù)十萬個 Ironwood 芯片組合在一起使用。

如今,Gemini 2.5 和諾貝爾獎成果 AlphaFold 都在 TPU 上運(yùn)行。

谷歌表示,之所以能長期提供如此實惠的模型價格,并持續(xù)提升模型速度,就是因為擁有強(qiáng)大的基礎(chǔ)設(shè)施,使其在經(jīng)濟(jì)效益上始終處于最優(yōu)。

價格優(yōu)勢不僅體現(xiàn)在模型層,也體現(xiàn)在了應(yīng)用層。

一個深遠(yuǎn)的影響是用戶期望如何被重新設(shè)定:既然 Gmail 可以起草電子郵件,搜索可以進(jìn)行對話,這些功能價格低廉甚至可能免費(fèi),人們就會將這些功能視為標(biāo)準(zhǔn)配置,這提高了任何競爭對手吸引用戶的門檻。

垂直行業(yè)比如醫(yī)療、法律、金融等尚有難以匹敵的數(shù)據(jù)護(hù)城河,但套殼公司的生存空間越來越狹小,可能需要極具創(chuàng)意的產(chǎn)品能力才能維持生存或異軍突起。

至于 OpenAI ,它最佳的防御策略,或許是繼續(xù)做自己最擅長的事情:快速創(chuàng)新核心模型,至于生態(tài)這件事,還是讓其它公司代勞吧。

參考資料:

https://blog.google/technology/developers/google-io-2025-collection/

https://www.mittrchina.com/news/detail/14604

https://www.theverge.com/news/669238/apple-siri-llm-ai-revamp

撰文:流大古 編輯:大餅

本文由人人都是產(chǎn)品經(jīng)理作者【知?!?,微信公眾號:【知危】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!