谷歌王者歸來:Gemini 2.5 Pro屠榜AI編程界!三冠王碾壓Claude 3.7,網友直呼:Cursor白買了!
谷歌Gemini 2.5 Pro震撼登場,憑借卓越的編碼與多模態(tài)能力,一舉斬獲三冠王寶座,全面超越Claude 3.7,引領AI編程新紀元,開發(fā)者盛宴由此開啟!
最近真的不太平!AI界又是一聲驚雷!谷歌Gemini 2.5 Pro Preview的I/O版,本是想藏著掖著等幾周后的Google I/O大會的,結果大家對Gemini 2.5 Pro編碼和多模態(tài)推理功能的熱情太高漲,干脆提前放!讓開發(fā)者們爽個夠!
太長不看版,直接劃重點:
- 深夜突襲! 谷歌Gemini 2.5 Pro Preview的I/O版提前重磅更新,號稱“史上最強編碼模型”!
- 三冠王登頂! 橫掃LMArena所有文本、視覺及WebDev Arena排行榜,干翻Claude 3.7 Sonnet,成為首個實現(xiàn)此壯舉的單一模型!
- 編碼能力爆表! 一張手繪草圖、一句提示詞就能搞定完整可交互的Web應用、游戲、模擬程序!視頻也能直接轉代碼生成學習應用!
- 網友炸鍋! “Cursor白買了!”、“這不就是Gemini 3嗎?!”、“休閑游戲行業(yè)要完蛋了!”。谷歌自家大佬也紛紛站臺!
文末附新功能組合使用場景表格一覽。
代碼能力屠榜!直接干碎所有對手!
這貨一出來,直接在LMArena所有排行榜上干翻了Claude,登頂?shù)谝唬∥谋?、視覺、還有那個卷得不行的WebDev Arena,全給拿下了!這是有史以來單一模型首次達成如此成就,簡直是SOTA中的SOTA!
圖片
特別是在前端Web開發(fā)這塊,Gemini 2.5 Pro Preview (I/O版) 在WebDev Arena排行榜上直接飆到第一,得分1499.95,把Claude 3.7 Sonnet(1377.10分)遠遠甩在身后。跟自家之前的版本比,更是暴漲了147分(舊版1278.96分)!DeepMind CEO德米斯·哈薩比斯都輕描淡寫地表示:no big deal。(doge)
這下可好,網友們紛紛表示,Cursor可以卸載了,錢白交了!
(不用擔心,玩笑話罷了,AI編程雖然底層是大模型,但「穩(wěn)定寫代碼」更重要的是工程能力,目前這塊Cursor依然是王者。)
一句話、一張圖,應用秒生成!
這次更新的核心亮點,就是那逆天的“一提示生成應用”能力!你敢信?只需一張手繪草圖,或者一句簡單的提示詞,Gemini 2.5 Pro就能給你構建一個功能完備、可交互的網頁應用、游戲,甚至是復雜的對象模擬程序!
比如,你隨手畫個畫板應用的草圖,它就能生成一個帶UI的繪畫小程序。
圖片
AI藝術工具EverArt的CEO彼得羅·斯基拉諾就用它整了個“1只大猩猩大戰(zhàn)100人”的梗游戲,Hyperbolic的CTO Yuchen Jin更是直接放話:“Gemini 2.5 Pro Preview (05-06) 現(xiàn)已成為我的首選編程模型…谷歌,這完全夠格稱為Gemini 3了!” 還有網友用不到一分鐘就生成了帶真實音效的俄羅斯方塊風格游戲,直呼“休閑游戲行業(yè)要完蛋了!”
除了這種從零開始的騷操作,它在改進前端和UI開發(fā)、代碼轉換編輯、創(chuàng)建復雜代理工作流等方面也是一把好手。比如,給現(xiàn)有項目加個Win95風格的視頻播放器,風格復刻得妥妥的。
圖片
多模態(tài)再進化!視頻理解、代碼維護也起飛!
Gemini 2.5 Pro (I/O版) 的多模態(tài)能力依然強勢,視頻理解能力在VideoMME基準測試中拿下了84.8%的高分!這意味著它可以直接從單個YouTube視頻創(chuàng)建交互式學習應用,UI也比舊版更完善。
圖片
谷歌DeepMind的研究員們也紛紛曬出用“氛圍編程”(Vibe Code)搞出來的各種Demo,像是芝加哥藝術學院收藏品的3D導覽、智能花園規(guī)劃器、聽音畫猜游戲、圖書推薦應用等等,簡直玩瘋了!
圖片
針對企業(yè)級開發(fā),它的代碼維護能力也得到了強化??缈蚣苓w移(比如React轉Vue,Angular轉Next.js)錯誤率極低,還能有效規(guī)避“AI幻覺”導致的API調用錯誤(錯誤率降低40%),并能自動生成符合JSDoc規(guī)范的注釋,技術審查效率直接起飛!Cursor的CEO Michael Truell都說新模型在調用工具時的失敗率顯著降低了!
開發(fā)者怎么用?價格香不香?
這么牛的模型,開發(fā)者們已經可以通過Google AI Studio和Vertex AI在Gemini API中開始使用了。Gemini App的用戶也能體驗到它的強大。
價格方面,谷歌表示:加量不加價!目前使用Gemini 2.5 Pro的用戶將自動切換至新模型,價格仍為每百萬輸入token收費1.25美元,每百萬輸出token收費10美元,上下文窗口最多支持20萬token。對比Claude 3.7 Sonnet的15美元,這價格,真香!
AI大佬Andrew Curran對此評價道:“Gemini取代Gemini是一個信號,表明有些事情已經發(fā)生了變化。谷歌在各個方面都在穩(wěn)步發(fā)展。頭把交椅仍會易主,但巨龍已經蘇醒了。”
本文由人人都是產品經理作者【餅干哥哥】,微信公眾號:【餅干哥哥AGI】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!