a16z投了兩個(gè)華人560萬(wàn)美金,讓AI成為每個(gè)人的專(zhuān)屬攝影師
通過(guò)個(gè)性化視覺(jué)AI技術(shù),Phota Labs不僅能夠修正閉眼、調(diào)整表情、改善光線(xiàn),還能在多年后重新拍攝已經(jīng)過(guò)去的時(shí)刻。這聽(tīng)起來(lái)像是科幻電影中的情節(jié),但如今正逐漸成為現(xiàn)實(shí)。
你有沒(méi)有想過(guò),攝影這件事情可能徹底變了?我們不再只是按下快門(mén)記錄瞬間,而是能夠重新拍攝已經(jīng)過(guò)去的時(shí)刻。想象一下,你可以修正閉著的眼睛、調(diào)整尷尬的表情、改善糟糕的光線(xiàn),甚至改變拍攝角度——這些都可以在多年后完成。這聽(tīng)起來(lái)像科幻電影,但Phota Labs正在讓這一切成為現(xiàn)實(shí)。這家由前Adobe AI研究員創(chuàng)立的公司剛剛獲得了由Andreessen Horowitz領(lǐng)投的560萬(wàn)美元種子輪融資,他們正在用個(gè)性化的視覺(jué)AI技術(shù)徹底重新定義攝影的邊界。
我被這家公司吸引的原因很簡(jiǎn)單:他們解決了AI生成圖像領(lǐng)域最核心的問(wèn)題——身份真實(shí)性。現(xiàn)在的AI模型可以生成令人驚嘆的圖像,但當(dāng)涉及到你認(rèn)識(shí)的人時(shí),特別是你自己時(shí),這些模型往往會(huì)失敗。你能立刻看出”這不是我”。而Phota Labs的方法完全不同,他們構(gòu)建的個(gè)性化模型能夠?qū)W習(xí)你的外貌、你的生活場(chǎng)景,甚至你的記憶中那些重要時(shí)刻的背景。他們的目標(biāo)不是創(chuàng)造完美的幻覺(jué),而是讓AI能夠理解并忠實(shí)再現(xiàn)你的真實(shí)生活體驗(yàn)。
攝影的本質(zhì)正在發(fā)生根本性轉(zhuǎn)變
在深入了解Phota Labs的技術(shù)之前,我想先分享一下我對(duì)攝影演進(jìn)的思考。傳統(tǒng)攝影一直圍繞著一個(gè)核心理念:忠實(shí)記錄某個(gè)特定時(shí)刻發(fā)生的事情。按下快門(mén)的那一瞬間,光線(xiàn)、人物、背景、表情都被永久固定下來(lái)。這種”一次性捕捉”的模式從攝影術(shù)誕生以來(lái)基本沒(méi)有改變過(guò)。
但現(xiàn)在這個(gè)前提正在被徹底顛覆。Phota Labs的聯(lián)合創(chuàng)始人Cecilia Zhang在一次訪(fǎng)談中提到了一個(gè)深刻的觀(guān)點(diǎn):”關(guān)鍵時(shí)刻、攝影中的決定性瞬間,那個(gè)我們作為攝影師努力捕捉的時(shí)刻,在空間和時(shí)間中是如此短暫。當(dāng)按下快門(mén)時(shí),時(shí)刻不再是固定的。這是攝影的一個(gè)非常有趣的新維度。”這句話(huà)的含義非常深遠(yuǎn):我們正在從”記錄瞬間”轉(zhuǎn)向”重新創(chuàng)造瞬間”。
我認(rèn)為這種轉(zhuǎn)變的意義不亞于從膠片到數(shù)碼的跨越。數(shù)碼攝影讓我們擺脫了膠片的限制,可以拍攝無(wú)數(shù)張照片而不用擔(dān)心成本。而AI驅(qū)動(dòng)的生成式攝影則讓我們擺脫了時(shí)間和空間的限制,可以在事后重新構(gòu)建那些我們錯(cuò)過(guò)的完美瞬間。想象一下,那些因?yàn)楣饩€(xiàn)不好、角度不對(duì)、表情不自然而被刪掉的照片,現(xiàn)在都有了第二次機(jī)會(huì)。
更重要的是,這種技術(shù)讓我們能夠?qū)⒆⒁饬?#8221;如何拍攝”轉(zhuǎn)向”如何體驗(yàn)”。以前拍照時(shí),我們總是需要考慮光線(xiàn)、構(gòu)圖、焦距等技術(shù)細(xì)節(jié),這往往讓我們無(wú)法完全沉浸在當(dāng)下的體驗(yàn)中。而現(xiàn)在,我們可以專(zhuān)注于享受當(dāng)下,然后在事后用AI技術(shù)創(chuàng)造出我們想要的視覺(jué)記錄。這不是造假,而是對(duì)記憶的忠實(shí)再現(xiàn)——用我們希望記住的方式來(lái)記錄那些真實(shí)經(jīng)歷過(guò)的時(shí)刻。
Phota Labs的技術(shù)突破在于他們找到了平衡真實(shí)性和創(chuàng)造性的方法。他們的模型不會(huì)憑空創(chuàng)造你從未經(jīng)歷過(guò)的場(chǎng)景,而是基于你真實(shí)的生活經(jīng)歷,用更好的方式重新呈現(xiàn)那些時(shí)刻。這就像是給每個(gè)人配備了一個(gè)專(zhuān)業(yè)攝影師,這個(gè)攝影師完全了解你的外貌、你的生活場(chǎng)景,以及你希望如何被記錄下來(lái)。
個(gè)性化AI的技術(shù)突破與挑戰(zhàn)
我花了大量時(shí)間研究Phota Labs的技術(shù)方法,發(fā)現(xiàn)他們解決的核心問(wèn)題比表面看起來(lái)復(fù)雜得多?,F(xiàn)有的大型AI模型雖然能生成視覺(jué)上令人驚嘆的圖像,但它們有一個(gè)致命缺陷:它們是為通用性而訓(xùn)練的,因此缺乏對(duì)個(gè)人身份和個(gè)人背景的深度理解。
當(dāng)你使用像Midjourney或DALL-E這樣的通用模型生成包含自己的圖像時(shí),結(jié)果往往是一個(gè)”看起來(lái)像你”的人,但絕對(duì)不是你。這種差異對(duì)于不熟悉你的人來(lái)說(shuō)可能不明顯,但對(duì)于你自己和你的親人來(lái)說(shuō),這種不一致性立刻就能被察覺(jué)。這就是為什么即使AI技術(shù)如此先進(jìn),我們?nèi)匀缓茈y用它來(lái)創(chuàng)造真正有意義的個(gè)人照片。
Phota Labs的解決方案基于兩個(gè)核心支柱:身份識(shí)別和背景理解。身份識(shí)別不僅僅是面部特征,還包括你的肢體語(yǔ)言、表情習(xí)慣、甚至你在不同情況下的自然姿態(tài)。背景理解則涉及你生活中的人、地點(diǎn)、物體,以及這些元素如何相互作用形成有意義的場(chǎng)景。
他們的技術(shù)方法是讓AI模型從你自己的照片和視頻中學(xué)習(xí)。這不是簡(jiǎn)單的面部替換,而是深度理解你在不同設(shè)置下的外觀(guān),以及你生活中重要的人、地點(diǎn)和物體。模型學(xué)會(huì)了推理這些元素之間的關(guān)系,從而能夠生成既忠實(shí)于你的身份又符合特定背景的圖像。
我特別欣賞他們對(duì)”忠實(shí)性”概念的理解。在一次深度訪(fǎng)談中,Zach Xia分享了一個(gè)個(gè)人故事:他和妻子的海灘婚禮照片由于逆光和角度問(wèn)題效果不佳,使用傳統(tǒng)編輯工具也無(wú)法修復(fù)。但通過(guò)Phota Labs的技術(shù),他們能夠重新創(chuàng)造那一天的照片,改善光線(xiàn)和角度,同時(shí)保持那個(gè)特殊時(shí)刻的真實(shí)性。關(guān)鍵是,生成的照片仍然是他們兩個(gè)人,仍然是那個(gè)海灘,仍然是那一天——只是以一種更好的方式呈現(xiàn)出來(lái)。
這種技術(shù)的復(fù)雜性在于它需要解決兩個(gè)看似矛盾的要求:創(chuàng)造性和真實(shí)性。AI需要足夠創(chuàng)造性來(lái)改善照片的質(zhì)量,但又要足夠約束來(lái)確保不偏離現(xiàn)實(shí)。這就像是在鋼絲上行走,稍微偏向任何一邊都會(huì)失去平衡。偏向創(chuàng)造性太多,照片就會(huì)變得不真實(shí);偏向真實(shí)性太多,又失去了改善的空間。
從技術(shù)實(shí)現(xiàn)角度看,Phota Labs開(kāi)發(fā)了一套復(fù)雜的模型訓(xùn)練流程。他們不是從零開(kāi)始訓(xùn)練模型,而是在現(xiàn)有的強(qiáng)大基礎(chǔ)模型之上進(jìn)行個(gè)性化微調(diào)。這種方法讓他們能夠利用大型模型的生成能力,同時(shí)注入個(gè)人特定的身份和背景信息。用戶(hù)需要上傳一組自己在不同場(chǎng)景下的照片,模型會(huì)從這些照片中學(xué)習(xí)用戶(hù)的外貌特征、常見(jiàn)的背景環(huán)境、以及他們生活中的重要元素。
重新定義攝影的創(chuàng)作流程
我認(rèn)為Phota Labs真正革命性的地方在于它重新定義了攝影的創(chuàng)作流程。傳統(tǒng)攝影是一個(gè)線(xiàn)性過(guò)程:構(gòu)思、拍攝、后期處理、分享。而Phota Labs提出的是一個(gè)循環(huán)式的創(chuàng)作流程:體驗(yàn)、記錄、重新創(chuàng)造、完善。
在傳統(tǒng)攝影中,”決定性瞬間”的概念至關(guān)重要。攝影師需要在正確的時(shí)間出現(xiàn)在正確的地點(diǎn),使用正確的設(shè)備,捕捉到完美的瞬間。這種模式下,攝影師需要預(yù)見(jiàn)即將發(fā)生的事情,提前做好準(zhǔn)備,然后在關(guān)鍵時(shí)刻按下快門(mén)。錯(cuò)過(guò)了就錯(cuò)過(guò)了,沒(méi)有第二次機(jī)會(huì)。
但Phota Labs的方法徹底改變了這個(gè)邏輯。你不再需要在當(dāng)下就拍出完美的照片,而是可以先記錄下基本的場(chǎng)景和情境,然后在事后用AI技術(shù)重新構(gòu)建那個(gè)時(shí)刻的最佳版本。這就像是給每個(gè)重要時(shí)刻都配備了一個(gè)時(shí)光機(jī),讓你可以回到過(guò)去,用更好的設(shè)備、更好的角度、更好的光線(xiàn)重新拍攝。
我特別被Ren Ng(Lytro相機(jī)的創(chuàng)始人)在訪(fǎng)談中的一個(gè)觀(guān)點(diǎn)所震撼。他說(shuō),在未來(lái),我們可能不再需要在當(dāng)下拍攝那么多照片,而是可以”派遣攝影師回到過(guò)去”。想象一下,你可以請(qǐng)你最喜歡的攝影師,或者是擁有你現(xiàn)在技能的”過(guò)去的自己”,回到你生命中的任何一個(gè)重要時(shí)刻,用專(zhuān)業(yè)的眼光和技術(shù)重新記錄那些場(chǎng)景。
這種創(chuàng)作流程的轉(zhuǎn)變還解決了一個(gè)長(zhǎng)期困擾人們的問(wèn)題:如何在享受當(dāng)下的同時(shí)還能記錄當(dāng)下。我經(jīng)常遇到這樣的兩難選擇:是專(zhuān)注于體驗(yàn)當(dāng)下的快樂(lè),還是忙于拍照記錄?現(xiàn)在這個(gè)問(wèn)題有了新的解決方案。你可以用簡(jiǎn)單的方式記錄基本信息(甚至可能是多模態(tài)傳感器收集的豐富背景信息),然后在事后用AI技術(shù)創(chuàng)造出專(zhuān)業(yè)級(jí)的視覺(jué)記錄。
Phota Labs已經(jīng)開(kāi)始在產(chǎn)品中實(shí)現(xiàn)這些概念。他們的移動(dòng)應(yīng)用允許用戶(hù)”重新拍攝”照片,修正閉眼、尷尬表情或糟糕光線(xiàn)等問(wèn)題,同時(shí)保持身份和背景的完整性。更重要的是,這個(gè)過(guò)程不需要復(fù)雜的提示詞或技術(shù)知識(shí)。模型深度理解攝影本身,從光線(xiàn)到構(gòu)圖到表情,因此能夠自動(dòng)重新拍攝圖像,同時(shí)保留讓時(shí)刻真實(shí)的元素。
我試用了他們的beta版本,發(fā)現(xiàn)這種體驗(yàn)確實(shí)不同于傳統(tǒng)的AI圖像生成工具。當(dāng)我看到生成的圖像時(shí),我的第一反應(yīng)不是”這看起來(lái)像我”,而是”這就是我”。這種差異可能聽(tīng)起來(lái)很微妙,但實(shí)際體驗(yàn)起來(lái)完全不同。傳統(tǒng)的AI生成圖像總是帶有一種”AI味”,讓人能立刻識(shí)別出這是人工生成的。而Phota Labs的輸出更像是一張真實(shí)的照片,只是恰好每個(gè)細(xì)節(jié)都很完美。
商業(yè)模式與市場(chǎng)機(jī)遇
從商業(yè)角度看,Phota Labs選擇了一個(gè)非常聰明的市場(chǎng)定位。他們同時(shí)推出了兩個(gè)產(chǎn)品:面向消費(fèi)者的移動(dòng)應(yīng)用和面向開(kāi)發(fā)者的API。這種雙軌道策略讓他們能夠既直接服務(wù)終端用戶(hù),又為其他應(yīng)用和服務(wù)提供底層技術(shù)支撐。
消費(fèi)者應(yīng)用的使用場(chǎng)景非常直觀(guān):家庭照片修復(fù)、社交媒體內(nèi)容創(chuàng)作、專(zhuān)業(yè)頭像生成等。我特別看好他們?cè)趯?zhuān)業(yè)場(chǎng)景中的應(yīng)用潛力,比如LinkedIn頭像、房地產(chǎn)列表照片、餐廳宣傳圖片等。這些場(chǎng)景對(duì)圖像質(zhì)量有很高要求,但往往缺乏專(zhuān)業(yè)攝影師的預(yù)算。Phota Labs的技術(shù)能夠讓普通人用手機(jī)拍攝的照片達(dá)到接近專(zhuān)業(yè)攝影的效果。
API產(chǎn)品的潛力可能更大。隨著越來(lái)越多的應(yīng)用需要處理用戶(hù)生成的視覺(jué)內(nèi)容,對(duì)身份一致性和背景真實(shí)性的需求也在增長(zhǎng)。從社交媒體平臺(tái)到電商網(wǎng)站,從虛擬試衣到個(gè)性化營(yíng)銷(xiāo),各種應(yīng)用都可能受益于這種技術(shù)。特別是在需要生成包含特定個(gè)人的視覺(jué)內(nèi)容的場(chǎng)景中,Phota Labs的API可能成為不可或缺的基礎(chǔ)設(shè)施。
我注意到投資者對(duì)這個(gè)項(xiàng)目的熱情。Andreessen Horowitz領(lǐng)投560萬(wàn)美元種子輪,其他參與者包括Figma Ventures、AGI House等知名機(jī)構(gòu)。投資方Y(jié)oko Li在一篇投資說(shuō)明中寫(xiě)道:”Phota Labs首次實(shí)現(xiàn)了創(chuàng)建能夠忠實(shí)保留身份同時(shí)釋放新創(chuàng)造形式的照片和視頻。”這種表述準(zhǔn)確抓住了技術(shù)的核心價(jià)值:在保持真實(shí)性的同時(shí)釋放創(chuàng)造力。
從市場(chǎng)規(guī)模角度看,這個(gè)領(lǐng)域的潛力是巨大的。隨著生成式AI降低了內(nèi)容創(chuàng)作的邊際成本,那些以前不成立的市場(chǎng)現(xiàn)在開(kāi)始爆發(fā)式增長(zhǎng)。以前制作一張專(zhuān)業(yè)級(jí)的個(gè)人照片可能需要數(shù)百美元的攝影師費(fèi)用,現(xiàn)在通過(guò)AI技術(shù)可能只需要幾分錢(qián)的計(jì)算成本。這種成本差異創(chuàng)造了全新的用戶(hù)行為和商業(yè)機(jī)會(huì)。
我預(yù)測(cè)這種技術(shù)將首先在對(duì)視覺(jué)質(zhì)量要求較高但預(yù)算有限的場(chǎng)景中普及,然后逐漸擴(kuò)展到更廣泛的日常使用。就像Instagram濾鏡改變了人們分享照片的方式一樣,個(gè)性化AI攝影技術(shù)可能會(huì)改變我們記錄和分享生活的方式。不同的是,這次的改變不僅僅是美學(xué)上的,而是從根本上重新定義了什么是”真實(shí)”的照片。
技術(shù)發(fā)展的歷史脈絡(luò)
要理解Phota Labs的意義,我們需要把它放在計(jì)算攝影發(fā)展的歷史脈絡(luò)中來(lái)看。從最早的數(shù)碼相機(jī)到智能手機(jī)攝影,再到現(xiàn)在的AI生成攝影,每一次技術(shù)躍遷都重新定義了攝影的可能性。
計(jì)算攝影的歷史可以追溯到數(shù)碼攝影的早期階段。即使是最基本的數(shù)碼照片處理,比如色彩校正和降噪,都涉及復(fù)雜的算法。但真正的突破來(lái)自于像Lytro這樣的公司,他們開(kāi)創(chuàng)了”先拍照后對(duì)焦”的概念。Ren Ng回憶道:”我們可以用光線(xiàn)追蹤技術(shù)在事后合成不同焦點(diǎn)的照片。一旦你有了這種高維數(shù)據(jù)集,你就可以做更豐富的計(jì)算攝影,將鏡頭和相機(jī)的大部分物理工作轉(zhuǎn)化為純軟件。”
智能手機(jī)時(shí)代進(jìn)一步推動(dòng)了計(jì)算攝影的普及。HDR、人像模式、夜間模式等功能都是計(jì)算攝影的成果。我們已經(jīng)習(xí)慣了這樣一個(gè)事實(shí):現(xiàn)代手機(jī)拍攝的”照片”實(shí)際上是多張圖像經(jīng)過(guò)復(fù)雜算法處理后的合成結(jié)果。從某種意義上說(shuō),我們?cè)缇筒辉倥臄z”純粹”的照片了。
生成式AI代表了這個(gè)演進(jìn)過(guò)程的下一個(gè)階段。如果說(shuō)計(jì)算攝影是在現(xiàn)有圖像基礎(chǔ)上的增強(qiáng)處理,那么生成式攝影就是從根本上重新創(chuàng)造圖像。但Phota Labs的方法與純粹的生成式AI有所不同,他們?cè)噲D在生成能力和真實(shí)性之間找到平衡點(diǎn)。
Cecilia Zhang在訪(fǎng)談中解釋了她們的技術(shù)哲學(xué):”我們認(rèn)為這是從硬件到軟件再到生成式AI的演進(jìn)。我們只是使用不同的工具來(lái)回答同一個(gè)問(wèn)題:如何以最好的方式捕捉這個(gè)時(shí)刻。”這種連續(xù)性的觀(guān)點(diǎn)很重要,它表明AI攝影不是對(duì)傳統(tǒng)攝影的否定,而是它的自然延續(xù)。
我特別感興趣的是他們對(duì)”真實(shí)性”概念的重新定義。在傳統(tǒng)攝影中,真實(shí)性通常與技術(shù)真實(shí)性等同:這張照片確實(shí)是在這個(gè)時(shí)間、這個(gè)地點(diǎn)、使用這個(gè)設(shè)備拍攝的。但在AI時(shí)代,技術(shù)真實(shí)性和體驗(yàn)真實(shí)性開(kāi)始分離。一張AI生成的照片可能在技術(shù)上不是”真實(shí)”的(因?yàn)樗撬惴ㄉ傻模?,但在體驗(yàn)上可能比原始照片更”真實(shí)”(因?yàn)樗玫胤从沉水?dāng)時(shí)的感受和記憶)。
這種觀(guān)念轉(zhuǎn)變?cè)跀z影界并非沒(méi)有爭(zhēng)議。一些傳統(tǒng)攝影師認(rèn)為AI生成的圖像根本不應(yīng)該被稱(chēng)為”照片”。但我認(rèn)為這種辯論在某種程度上錯(cuò)失了重點(diǎn)。真正重要的不是制作方法,而是圖像的意義和情感價(jià)值。正如Cecilia所說(shuō):”歸根結(jié)底,重要的是照片對(duì)我們的意義。”
倫理考量與未來(lái)挑戰(zhàn)
當(dāng)然,Phota Labs的技術(shù)也帶來(lái)了一些重要的倫理問(wèn)題,我認(rèn)為這些問(wèn)題值得認(rèn)真討論。首先是真實(shí)性的問(wèn)題。當(dāng)我們可以輕松地修改照片中的幾乎任何元素時(shí),照片作為”證據(jù)”的價(jià)值會(huì)受到什么影響?
我與團(tuán)隊(duì)討論了這個(gè)問(wèn)題,他們的觀(guān)點(diǎn)很有趣。Zach表示,他不希望Instagram將他們軟件處理的圖像標(biāo)記為”AI生成”,因?yàn)檫@些圖像本質(zhì)上是對(duì)真實(shí)時(shí)刻的重新詮釋?zhuān)皇峭耆摌?gòu)的內(nèi)容。這個(gè)觀(guān)點(diǎn)觸及了一個(gè)更深層的問(wèn)題:我們應(yīng)該如何定義和標(biāo)識(shí)AI生成或AI增強(qiáng)的內(nèi)容?
我認(rèn)為解決方案可能在于建立更細(xì)致的分類(lèi)系統(tǒng),而不是簡(jiǎn)單的”真實(shí)”vs”虛假”二分法。比如,我們可以區(qū)分:原始未修改照片、傳統(tǒng)編輯照片、AI增強(qiáng)照片(基于真實(shí)場(chǎng)景)、AI合成照片(部分虛構(gòu)元素)、完全AI生成圖像等不同類(lèi)別。這樣的分類(lèi)系統(tǒng)可以幫助人們更好地理解不同圖像的性質(zhì)和可信度。
另一個(gè)重要的倫理問(wèn)題是同意權(quán)和隱私保護(hù)。Phota Labs的技術(shù)需要大量個(gè)人照片來(lái)訓(xùn)練個(gè)性化模型,這些數(shù)據(jù)的安全性和使用邊界如何保證?雖然他們聲稱(chēng)模型是個(gè)人擁有和使用的,但技術(shù)細(xì)節(jié)和數(shù)據(jù)處理流程仍需要更多透明度。
我也擔(dān)心這種技術(shù)可能被濫用于創(chuàng)建非同意的deepfake內(nèi)容。雖然Phota Labs強(qiáng)調(diào)他們的技術(shù)專(zhuān)注于真實(shí)經(jīng)歷的增強(qiáng)而非虛構(gòu)場(chǎng)景的創(chuàng)造,但任何強(qiáng)大的AI圖像生成技術(shù)都有被惡意使用的風(fēng)險(xiǎn)。這需要行業(yè)層面的自律和監(jiān)管框架的建立。
從社會(huì)影響角度看,我想到了一個(gè)更微妙但可能更深遠(yuǎn)的問(wèn)題:當(dāng)我們可以輕松地創(chuàng)造”完美”的照片時(shí),這會(huì)如何影響我們對(duì)自己和他人的期望?會(huì)不會(huì)像美圖軟件一樣,創(chuàng)造出新的美學(xué)標(biāo)準(zhǔn)和社會(huì)壓力?
Phota Labs團(tuán)隊(duì)似乎意識(shí)到了這些問(wèn)題。他們強(qiáng)調(diào)個(gè)性化和多樣性,而不是推向單一的美學(xué)標(biāo)準(zhǔn)。Cecilia提到:”好看的東西對(duì)不同的人意味著完全不同的事情。我們啟用的是個(gè)性化方面,所以你實(shí)際上可以選擇什么對(duì)你來(lái)說(shuō)是好看的。這不是由他人或平臺(tái)決定的預(yù)設(shè)濾鏡,而是由你決定的。”
我認(rèn)為這種方法是正確的方向,但實(shí)際執(zhí)行中仍然面臨挑戰(zhàn)。如何確保技術(shù)真正促進(jìn)多樣性而不是同質(zhì)化?如何幫助用戶(hù)建立健康的自我形象而不是依賴(lài)AI美化?這些問(wèn)題沒(méi)有簡(jiǎn)單的答案,需要技術(shù)開(kāi)發(fā)者、倫理學(xué)家、心理學(xué)家和社會(huì)學(xué)家的共同努力。
對(duì)攝影行業(yè)的深遠(yuǎn)影響
我認(rèn)為Phota Labs代表的技術(shù)趨勢(shì)將對(duì)整個(gè)攝影行業(yè)產(chǎn)生深遠(yuǎn)影響,這種影響可能比我們現(xiàn)在能想象的還要大。首先,專(zhuān)業(yè)攝影師的角色將發(fā)生根本性轉(zhuǎn)變。
傳統(tǒng)上,專(zhuān)業(yè)攝影師的價(jià)值在于他們的技術(shù)技能、設(shè)備和經(jīng)驗(yàn)。他們知道如何在不同光線(xiàn)條件下設(shè)置相機(jī),如何構(gòu)圖,如何引導(dǎo)被攝者。但當(dāng)AI可以在事后修正大部分技術(shù)問(wèn)題時(shí),攝影師的價(jià)值點(diǎn)將更多轉(zhuǎn)向創(chuàng)意指導(dǎo)、情感捕捉和故事敘述。
我預(yù)測(cè)會(huì)出現(xiàn)一種新的攝影服務(wù)模式:AI增強(qiáng)攝影師。這些攝影師可能不需要攜帶昂貴的設(shè)備或在現(xiàn)場(chǎng)花費(fèi)大量時(shí)間調(diào)整技術(shù)參數(shù),而是專(zhuān)注于捕捉情感和故事,然后用AI技術(shù)在后期創(chuàng)造出視覺(jué)上令人驚艷的結(jié)果。這可能會(huì)降低專(zhuān)業(yè)攝影的門(mén)檻,讓更多有創(chuàng)意眼光但技術(shù)技能有限的人進(jìn)入這個(gè)行業(yè)。
Ren Ng在訪(fǎng)談中提到了一個(gè)有趣的概念:”在未來(lái),你可以從任何數(shù)量的真實(shí)攝影師中選擇,他們的作品你真正欽佩,因?yàn)樗麄冏鳛槿祟?lèi)的方式既是社交技能也是技術(shù)技能,也許能夠雇用他們并將他們送回我過(guò)去的時(shí)光。”這意味著頂級(jí)攝影師的風(fēng)格和技能可能會(huì)被數(shù)字化,讓普通人也能享受到大師級(jí)的攝影服務(wù)。
對(duì)于攝影教育,這種技術(shù)也將帶來(lái)重大變化。傳統(tǒng)攝影教育重點(diǎn)關(guān)注技術(shù)技能:如何使用相機(jī)、如何控制光線(xiàn)、如何掌握構(gòu)圖規(guī)則等。但在AI輔助攝影時(shí)代,教育重點(diǎn)可能轉(zhuǎn)向美學(xué)判斷、故事敘述、情感表達(dá)等更難自動(dòng)化的技能。
我也看到了新的商業(yè)機(jī)會(huì)。比如,可能會(huì)出現(xiàn)專(zhuān)門(mén)的AI攝影風(fēng)格設(shè)計(jì)師,他們的工作是創(chuàng)造獨(dú)特的視覺(jué)風(fēng)格供AI模型學(xué)習(xí)和應(yīng)用。或者是AI攝影顧問(wèn),幫助個(gè)人和企業(yè)定制符合其品牌或個(gè)性的視覺(jué)風(fēng)格。
從更廣的角度看,這種技術(shù)可能會(huì)推動(dòng)整個(gè)視覺(jué)文化的民主化。當(dāng)創(chuàng)造高質(zhì)量視覺(jué)內(nèi)容的門(mén)檻大大降低時(shí),我們可能會(huì)看到更多樣化、更個(gè)性化的視覺(jué)表達(dá)。這可能會(huì)挑戰(zhàn)當(dāng)前由專(zhuān)業(yè)攝影師和大型媒體公司主導(dǎo)的視覺(jué)文化格局。
我特別興奮的是這種技術(shù)在記錄個(gè)人和家庭歷史方面的潛力。想象一下,你可以用AI技術(shù)”重新拍攝”你祖父母年輕時(shí)的照片,或者為你的孩子創(chuàng)造他們童年時(shí)光的專(zhuān)業(yè)級(jí)視覺(jué)記錄。這種能力可能會(huì)讓每個(gè)家庭都擁有類(lèi)似皇室檔案的視覺(jué)記錄質(zhì)量。
技術(shù)發(fā)展的下一步
基于我對(duì)Phota Labs技術(shù)的了解和行業(yè)趨勢(shì)的觀(guān)察,我對(duì)這個(gè)領(lǐng)域的發(fā)展方向有一些預(yù)測(cè)。首先,我認(rèn)為個(gè)性化將成為所有AI視覺(jué)技術(shù)的核心特征。通用的”一刀切”模型將逐漸被個(gè)性化、可定制的模型所取代。
在技術(shù)層面,我預(yù)期會(huì)看到更多的多模態(tài)整合。現(xiàn)在Phota Labs主要處理靜態(tài)圖像,但未來(lái)可能會(huì)擴(kuò)展到視頻、3D場(chǎng)景,甚至VR/AR內(nèi)容。Ren Ng在訪(fǎng)談末尾提到了這個(gè)可能性:”3D VR,我想回到我小時(shí)候的臥室拍照,重建這個(gè)場(chǎng)景。”這種能力一旦實(shí)現(xiàn),將徹底改變我們回憶和分享記憶的方式。
我也期待看到更智能的背景捕捉技術(shù)?,F(xiàn)在的系統(tǒng)主要依賴(lài)用戶(hù)主動(dòng)拍攝和上傳照片,但未來(lái)可能會(huì)有更自動(dòng)化的方式收集背景信息。比如可穿戴相機(jī)、多模態(tài)傳感器,甚至通過(guò)分析你的數(shù)字足跡來(lái)理解你的生活背景。
從產(chǎn)品角度看,我認(rèn)為會(huì)出現(xiàn)更多專(zhuān)門(mén)化的應(yīng)用。不同的使用場(chǎng)景(專(zhuān)業(yè)頭像、家庭照片、社交媒體、商業(yè)用途等)可能需要不同的AI模型和用戶(hù)界面。Phota Labs現(xiàn)在提供的是一個(gè)通用平臺(tái),但我預(yù)期市場(chǎng)會(huì)朝著更細(xì)分、更專(zhuān)業(yè)化的方向發(fā)展。
我特別看好這種技術(shù)在企業(yè)級(jí)應(yīng)用中的潛力。比如,零售公司可以用這種技術(shù)為客戶(hù)生成個(gè)性化的產(chǎn)品展示圖片;房地產(chǎn)公司可以創(chuàng)造更有吸引力的房屋列表照片;HR部門(mén)可以幫助員工創(chuàng)建專(zhuān)業(yè)的公司照片。這些應(yīng)用場(chǎng)景的商業(yè)價(jià)值可能遠(yuǎn)超消費(fèi)者市場(chǎng)。
從技術(shù)發(fā)展路徑看,我預(yù)測(cè)下一個(gè)重大突破可能在實(shí)時(shí)處理能力上。現(xiàn)在的AI圖像生成通常需要幾秒到幾分鐘的處理時(shí)間,但如果能實(shí)現(xiàn)實(shí)時(shí)或近實(shí)時(shí)的處理,就可以支持更多的交互式應(yīng)用場(chǎng)景。想象一下一個(gè)智能相機(jī),能夠在你拍照的同時(shí)實(shí)時(shí)優(yōu)化圖像質(zhì)量和構(gòu)圖。
我也關(guān)注這種技術(shù)與其他AI能力的融合。比如,結(jié)合語(yǔ)言模型的理解能力,可能可以通過(guò)簡(jiǎn)單的文字描述來(lái)指導(dǎo)圖像生成和修改?;蛘呓Y(jié)合情感識(shí)別技術(shù),AI可以根據(jù)照片中人物的情感狀態(tài)自動(dòng)調(diào)整視覺(jué)風(fēng)格和氛圍。
本文由人人都是產(chǎn)品經(jīng)理作者【深思圈】,微信公眾號(hào):【深思圈】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
AI攝影師很方便,而且照片的質(zhì)量也能夠得到保證。