微軟和Google都找到了自己的AI重心
作為行業(yè)的領(lǐng)軍者,微軟和Google在近期的開發(fā)者大會上分別展示了其AI戰(zhàn)略的重心。微軟聚焦于構(gòu)建開放Agent網(wǎng)絡(luò),通過提供強(qiáng)大的開發(fā)環(huán)境、提升Agent開發(fā)效率、打造Agent載體以及建立網(wǎng)絡(luò)連接能力,吸引企業(yè)和開發(fā)者共同探索AI的未來。Google則以Gemini為核心,展示了其在大模型能力、搜索AI化、硬件應(yīng)用以及編程工具升級等方面的創(chuàng)新,致力于將AI融入到更多C端產(chǎn)品中。
微軟的Build 2025大會和Google的I/O開發(fā)者大會都選擇了在本周舉辦,并且兩場活動談?wù)摰暮诵亩际茿I。
不同的是,微軟的重心是向行業(yè)展示如何更好搭建Agent。微軟在Build 2025大會上向用戶呈現(xiàn)了一套更加成熟的Agent基礎(chǔ)設(shè)施,想要吸引更多開發(fā)者加入到構(gòu)建開放Agent網(wǎng)絡(luò)(Open Agentic Web)的進(jìn)程中——這是一個 AI 智能體能夠在個人、組織、團(tuán)隊乃至整個端到端業(yè)務(wù)流程中協(xié)同運(yùn)作的體系。
Google則致力于展示一個圍繞Gemini搭建的AI操作系統(tǒng)雛形。谷歌首席執(zhí)行官Sundar Pichai在演講中使用了「Gemini時代(Gemini Era)」來描述未來。一方面,Google展示了更強(qiáng)的模型研發(fā)能力;另一方面,Google在將Gemini的能力融入到各個C端產(chǎn)品中。
微軟和Google雖然重心不同,但其面向AI的戰(zhàn)略規(guī)劃都具備了一定的整體性,不再是進(jìn)行散點(diǎn)的嘗試,而是開始找到一條線,將散落的點(diǎn)串聯(lián)起來,成為一個體系。這個體系的使命就如Pichai所言——讓研究成果真正發(fā)揮作用,將其盡快轉(zhuǎn)化為現(xiàn)實(shí)應(yīng)用。
這是目前我們在國內(nèi)大廠中尚未觀察到的一種變化。我們能夠觀察到阿里、騰訊、字節(jié)都在模型基礎(chǔ)層、業(yè)務(wù)AI化和產(chǎn)品創(chuàng)新方面進(jìn)行著積極布局,但很難像總結(jié)本次微軟和Google一樣,為國內(nèi)廠商提煉出一面指引整個企業(yè)向前推進(jìn)的旗幟。蘋果也是如此。
這可能是由于謹(jǐn)慎,也可能是還未下定決心。但無論出于何種考量,旗幟的出現(xiàn)都將是企業(yè)的AI戰(zhàn)略推進(jìn)到下一個階段的標(biāo)志之一。
微軟:一切為了開放代理網(wǎng)絡(luò)
一個展現(xiàn)出神奇效果,但還不夠成熟的起步階段——這是微軟在Build 2025大會上對當(dāng)下AI技術(shù)發(fā)展階段的判斷。微軟CEO Satya Nadella選擇用1991年的Win32、1996年的Web棧以及2008年的智能手機(jī)來類比當(dāng)下AI所處的發(fā)展階段。
以上這些節(jié)點(diǎn),并不是一個C端用戶大爆發(fā)的節(jié)點(diǎn),而是B端用戶面向未來布局的開始。
因此,微軟將重心放在吸引更偏向B端的企業(yè)和開發(fā)者,并為其準(zhǔn)備了一個擁有豐富工具和設(shè)備的操作間。
我們可以將各種讓人眼花撩亂的工具和能力劃分為以下幾類:
第一類,提供開發(fā)環(huán)境的基礎(chǔ)能力,包括Windows AI Foundry和Azure AI Foundry等。前者是微軟為本地AI開發(fā)提供的開發(fā)環(huán)境,通過Foundry Local簡化了在設(shè)備上直接運(yùn)行AI模型、工具和智能體的過程。后者則是微軟提供的云端開發(fā)平臺,這次的一大更新是引進(jìn)了xAI的Grok 3與Grok 3 mini。
同時,微軟通過推出Azure AI Foundry Agent Service,讓專業(yè)開發(fā)者能夠編排多個專用Agent來處理復(fù)雜任務(wù)。微軟AI Agent副總裁Ray Smith認(rèn)為,試圖將一個復(fù)雜的、要求高可靠性的流程完全整合到單一Agent中,往往會面臨諸多挑戰(zhàn),將任務(wù)系統(tǒng)性地分解給多個Agent,則能顯著增強(qiáng)可靠性。
第二類,提升Agent的開發(fā)效率。在微軟的介紹中,已經(jīng)有1500萬開發(fā)者在使用GitHub Copilot功能,提升代碼開發(fā)效率,這個規(guī)模已經(jīng)占到GitHub總用戶數(shù)的十分之一。在最新的更新中,GitHub Copilot將能夠支持完成用戶分配的BUG修復(fù)、代碼維護(hù)等任務(wù),并能在VS Code中使用。
微軟還推出了Microsoft 365 Copilot Tuning,支持開發(fā)者使用針對公司數(shù)據(jù)、工作流程和風(fēng)格微調(diào)的模型來構(gòu)建更專屬的Agent。開發(fā)者可以通過低代碼的形式進(jìn)行模型的微調(diào),這個工作之前往往需要一整個數(shù)據(jù)科學(xué)團(tuán)隊耗費(fèi)數(shù)周時間才能完成。
第三類,提供Agent的載體。微軟在面向C端的Agent載體上并沒有著墨太多,反而是重點(diǎn)介紹了對協(xié)作產(chǎn)品Teams的升級。Nadella認(rèn)為,新的Teams真正將聊天、搜索、筆記、生成和Agent整合到一個直觀的框架中。這也是一個完整的AI的用戶界面,支持多人協(xié)作,并承載了Agent的流通。
第四類,提供網(wǎng)絡(luò)連接能力。一方面微軟開始全面支持MCP(Model Context Protocol)協(xié)議,這讓它想建立的Agent網(wǎng)絡(luò)具備了開放屬性和復(fù)雜的任務(wù)執(zhí)行能力。在現(xiàn)場演示中,應(yīng)用開發(fā)者使用VS Code中的GitHub Copilot功能和Windows的MCP協(xié)議,依靠3句話就實(shí)現(xiàn)了特定風(fēng)格網(wǎng)頁的開發(fā)。
第一句話的指令下,GitHub Copilot連接WSL (Windows Subsystem for Linux)的MCP服務(wù)器,完成了最新版本的Fedora安裝;第二句指令下,GitHub Copilot創(chuàng)建了一個網(wǎng)站項目;第三句指令下,GitHub Copilot利用MCP協(xié)議,從用戶的Figma客戶端中提取了相應(yīng)的設(shè)計細(xì)節(jié),并據(jù)此對網(wǎng)頁進(jìn)行了調(diào)整。
在MCP協(xié)議基礎(chǔ)上,微軟這次還提出了NLWeb概念。微軟CTO Kevin Scott認(rèn)為,MCP協(xié)議是AI時代的HTTP,而NLWeb則是AI時代的html,能夠讓任何擁有網(wǎng)站或API的人輕松地將其變成一個Agent。「每個NLWeb端點(diǎn)默認(rèn)都是一個MCP服務(wù)器,這意味著那些人們通過NLWeb提供的東西將可以被任何支持MCP的Agent訪問?!?/p>
微軟已經(jīng)圍繞開放代理網(wǎng)絡(luò)完成了對自身業(yè)務(wù)的基礎(chǔ)梳理。在這次梳理之后,微軟的產(chǎn)品體系將服務(wù)于AI時代的HTTP與html,借此來延續(xù)互聯(lián)網(wǎng)時代的榮光。
Google:用Gemini改造和連接一切
不同于微軟在Build 2025大會上呈現(xiàn)的服務(wù)企業(yè)和開發(fā)者的AI產(chǎn)品,Google在I/O大會上展示了讓更多C端用戶眼前一亮的創(chuàng)新。大模型能力的升級、搜索的AI化嘗試、Android XR的實(shí)用化展示,都加深了Google想要讓C端用戶更有效使用AI的判斷。
在模型層面,Google的模型能力進(jìn)展快速,且具備了更豐富的能力。首先,Gemini 2.5 Pro的推出,扭轉(zhuǎn)了市場對Google大模型業(yè)務(wù)的看法,使其成為大模型王冠的有力競爭者。其次,本次發(fā)布的視頻模型Veo 3和生圖模型Imagen 4,在展示效果上都獲得了比較正面的評價。
模型基礎(chǔ)上,Google發(fā)展出了不同的基礎(chǔ)Agent能力。其中,Project Astra主打低延遲的多模態(tài)能力,可以通過攝像頭和麥克風(fēng)觀察、理解周圍的環(huán)境,且具備長期記憶能力。Project Mariner則強(qiáng)調(diào)多任務(wù)處理能力,一次能處理12項任務(wù),能夠代理用戶瀏覽和使用網(wǎng)站,完成購買動作。
在I/O大會的現(xiàn)場演示中,這些基礎(chǔ)Agent能力已經(jīng)被應(yīng)用在了AI搜索、Chrome瀏覽器、Gemini App、智能眼鏡等C端產(chǎn)品的AI化改造中。
核心的搜索業(yè)務(wù)上,Google終于開始用AI加碼。5月20日開始,Google會向所有美國用戶推出AI 模式。用戶可以向Gemini提出幾百字的問題,也能在后續(xù)體驗(yàn)到多模態(tài)問答功能和Deep Research能力。Google也會在Chrome瀏覽器加入AI助手,幫助用戶總結(jié)提煉頁面信息。
目前,Gemini App的月活躍用戶數(shù)超過4億。Gemini Live將支持?jǐn)z像頭和屏幕共享,讓AI幫助用戶了解和記憶周圍的環(huán)境。并且,Gemini的Agent模式還將能夠幫助用戶找房、預(yù)約、訂票?,F(xiàn)場演示中,Gemini Live可以指導(dǎo)用戶學(xué)習(xí)如何修理自己的自行車,并幫助其打電話訂購所需零件。
軟件端之外,基礎(chǔ)Agent也被應(yīng)用在了硬件端。Android XR被Google視為Gemini時代走向大眾的首個Android平臺。在現(xiàn)場的演示中,我們看到了Gemini Live能力的硬件化。Google還計劃未來幾個月之內(nèi),把Gemini帶到手表、汽車儀表盤,甚至電視上。
同樣的,Google也升級了AI化的編程工具。一方面,名為Jules的編程Agent,可以像GitHub Copilot一樣實(shí)現(xiàn)異步開發(fā),可以自動重構(gòu)代碼、編寫測試。另一方面,升級之后的Gemini Code Assist支持代碼審核、長文件解析、多人協(xié)作,集成了個性化建議和團(tuán)隊代碼規(guī)范工具。
從基礎(chǔ)模型到軟件,再到硬件和編程工具,Gemini無疑是凝聚這一切的核心。Google的策略很簡單,就是要通過不斷將Gemini的模型能力產(chǎn)品化,融入到現(xiàn)有的和未來場景中,來搭建起一個面向AI時代的系統(tǒng)雛形。
國內(nèi)巨頭還未找到真正突破口
盡管具體方向不同,但微軟和Google共同驗(yàn)證了「AI走向應(yīng)用」的大趨勢。
只不過,微軟是在創(chuàng)造條件,讓人們能夠更輕松地探索AI應(yīng)用;Google則是要通過打造系統(tǒng),讓自己成為基礎(chǔ)的AI應(yīng)用。這是兩個公司所具備的不同資源和稟賦決定的——微軟以提供企業(yè)服務(wù)為主,Google面向的是C端市場。
如果以這兩家公司為參照物來觀察國內(nèi)的大廠,會發(fā)現(xiàn)阿里、騰訊、字節(jié)三家雖然還沒有拎出特別清晰的主線,但在做AI應(yīng)用的大趨勢下也是各有側(cè)重。
阿里在AI時代的優(yōu)勢體現(xiàn)在大模型和云服務(wù)上,to B向開發(fā)者提供支持、構(gòu)建開放Agent生態(tài)的路徑比較順暢。電商業(yè)務(wù)作為阿里在互聯(lián)網(wǎng)時代的C端優(yōu)勢,很難順暢轉(zhuǎn)換為AI時代的to C應(yīng)用支點(diǎn)。因此,夸克的重要性得到了提升。面向未來,阿里可能需要把Agent的發(fā)展勢能注入夸克。
騰訊更接近Google,擁有相對穩(wěn)固的C端產(chǎn)品體系和流量入口,會優(yōu)先考慮如何完成面向C端的存量產(chǎn)品改造和面向未來的C端產(chǎn)品創(chuàng)新,就像最近對QQ瀏覽器進(jìn)行的改造。但相比Google,騰訊的模型能力更弱,目前只能依靠DeepSeek和元寶雙模型驅(qū)動。騰訊雖然有增強(qiáng)自身大模型能力研發(fā)的動作,但還看不到騰訊版Gemini2.5出現(xiàn)的跡象。
字節(jié)也有C端流量,但短視頻也同樣難以直接轉(zhuǎn)換為AI時代的C端入口。這也是為什么字節(jié)會重視豆包大模型的多模態(tài)能力,并在三家中最為積極地去探索AI硬件。To B業(yè)務(wù)上,字節(jié)相對欠缺生態(tài)基礎(chǔ),需要找到更有效的開放方式。并且,與阿里一樣,字節(jié)也更需要一個開放的Agent生態(tài)。
到目前為止,這些側(cè)重也沒有催生出像微軟和Google一樣的戰(zhàn)略重心,看似布局全面的三家,都還沒找到自己的真正突破口。
作者 | 李威
本文由人人都是產(chǎn)品經(jīng)理作者【窄播】,微信公眾號:【窄播】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!