谷歌認(rèn)領(lǐng)最強(qiáng)AI版Photoshop!現(xiàn)在人人可用,效果確實(shí)強(qiáng)悍

0 評(píng)論 422 瀏覽 0 收藏 10 分鐘

曾以 “nano-banana” 之名在 AI 圖像編輯領(lǐng)域引發(fā)熱議的神秘模型,終被谷歌官方認(rèn)領(lǐng) —— 其真身是 Gemini 2.5 Flash Image。該模型不僅具備 SOTA 級(jí)圖像生成與編輯能力,能實(shí)現(xiàn)多圖融合、2D 轉(zhuǎn) 3D、圖像推理等強(qiáng)悍功能,還保持角色一致性與極速處理優(yōu)勢(shì),目前可在 Gemini 和 Google AI Studio 免費(fèi)使用。

爆火的神秘圖像編輯模型nano-banana,終于脫掉了“香蕉皮”!

就在今天,谷歌官方認(rèn)領(lǐng),并表明這個(gè)模型其實(shí)是Gemini 2.5 Flash Image。

最新一波官方Demo也來(lái)了:

還展現(xiàn)出了高超的圖像推理能力:

現(xiàn)在該模型可以在Gemini和Google AI Studio上免費(fèi)使用,同時(shí)API以每張圖像0.039$(折合人民幣0.28¥)的價(jià)格開(kāi)放。

模型的具體表現(xiàn)如何?一起來(lái)看~

出色的圖像編輯能力

官方給出了很多有趣的用法。

除了常規(guī)的修圖方式,它還可以合并最多三張圖片來(lái)創(chuàng)造新事物。

生成超現(xiàn)實(shí)藝術(shù),組合不同的照片元素,或無(wú)縫融合物體、顏色和紋理。

或者輕松實(shí)現(xiàn)設(shè)計(jì)想法。

還可以用幾張照片生成堪稱(chēng)電影畫(huà)面的連貫劇情故事。

而在官方實(shí)錘之前,網(wǎng)友們也早就被nano-banana的各種私家case吸引,開(kāi)啟瘋狂討論。

比如說(shuō)精準(zhǔn)改變面部表情和天氣。

或者讓禿頭男人重新?lián)碛胁煌l(fā)型。

網(wǎng)友表示:PhotoShop岌岌可危。

畢竟這個(gè)“香蕉”不僅可以完成平面圖像的編輯,甚至還可以進(jìn)行2D到3D的轉(zhuǎn)換。用戶(hù)只需提供一張普通的2D圖片,系統(tǒng)就可自動(dòng)生成相應(yīng)的3D視角,每一個(gè)角度都是恰到好處、和諧統(tǒng)一。

最最最牛的是,它竟然還可以進(jìn)行圖像推理。勾股定理so easy,計(jì)算角度手拿把掐,識(shí)別圖像里的水母結(jié)構(gòu),竟然也是瞬間反應(yīng),堪稱(chēng)你畫(huà)我猜AI版。

說(shuō)實(shí)話,最讓我佩服的是,當(dāng)我們要求此“香蕉”給出一個(gè)人從A到B的方案時(shí),它竟然直接生成一個(gè)梯子!

好好好,圖像編輯器真的能思考了。

我們自己也實(shí)測(cè)了一下這款模型,發(fā)現(xiàn)它確實(shí)很有意思:

給它一只貓貓,貓能環(huán)游世界。

提示詞:以這只貓為主角,生成旅游照。

提示詞:讓貓貓去故宮拍張自拍照。

如果不想做真實(shí)場(chǎng)景,讓林黛玉和孫悟空成為漫威英雄并肩戰(zhàn)斗也就一句話的事兒~

另外,它對(duì)光影的細(xì)節(jié)理解也相當(dāng)真實(shí)。

提示詞:一根香蕉被放在廚房臺(tái)面上,旁邊有水杯、刀具和切菜板,陽(yáng)光從窗戶(hù)照進(jìn)來(lái),香蕉投下自然陰影。

可以看到生成結(jié)果還是很不錯(cuò)滴,陽(yáng)光透過(guò)水杯折射的影子以及旁邊植物的影子都還算合理。

它還能夠很好地抓取角色特征,不出意外地改變角色主體:

如果那一年,工藤新一喝下的并不是縮小藥水,而是……

神秘香蕉模型

Nano Banana最初出現(xiàn)在一個(gè)名為L(zhǎng)MArena的網(wǎng)站上,這是一個(gè)讓不同AI模型匿名進(jìn)行“戰(zhàn)斗模式”競(jìng)賽的地方。

而讓Nano-banana爆火的原因無(wú)他,表現(xiàn)實(shí)在太好了。

這又是一個(gè)SOTA級(jí)別的圖像編輯模型——而且在一開(kāi)始沒(méi)有任何官方文檔。

不過(guò)在官方宣布之前,已經(jīng)有一些人猜到了這是谷歌家族的一員。

一方面,該模型的表現(xiàn)與Gemini近期發(fā)布的多模態(tài)版本相似,這樣出色的性能很難是車(chē)庫(kù)團(tuán)隊(duì)的產(chǎn)品。

另一方面,它的發(fā)布策略——匿名發(fā)布、無(wú)品牌標(biāo)識(shí)、讓用戶(hù)群體自行探索——與DeepMind早期在匿名測(cè)試平臺(tái)上評(píng)估大語(yǔ)言模型的方式如出一轍。

還有一點(diǎn)額外原因:一些與谷歌有關(guān)聯(lián)的開(kāi)發(fā)者在社交媒體上發(fā)了奇怪的香蕉內(nèi)容??

有網(wǎng)友問(wèn)到Google為什么要選擇秘密發(fā)布,官方給出了這樣的解釋?zhuān)?/p>

正在為全球規(guī)模的發(fā)布做準(zhǔn)備工作。

網(wǎng)友:何時(shí)發(fā)布完整版本

既然官方都那樣說(shuō)了,網(wǎng)友們也坐不住了。

紛紛表示:那我們能用完整版了嗎?

不過(guò),雖然這個(gè)模型在圖像生成的表現(xiàn)確實(shí)很好,但并不意味著它沒(méi)有問(wèn)題——

尤其是在大公司的服務(wù)政策下,很容易出現(xiàn)一些讓人比較抓狂的情況:

有網(wǎng)友認(rèn)為,這是一個(gè)非常有趣的營(yíng)銷(xiāo)方式,并且確實(shí)達(dá)到了他們想要的效果。

感興趣的朋友也可以去試一下這個(gè)香蕉,哦不,這個(gè)Gemini 2.5 Flash Image。

本文由人人都是產(chǎn)品經(jīng)理作者【量子位】,微信公眾號(hào):【量子位】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!