當(dāng)Vision Pro+AI Sora,將碰撞出什么火花?
Vision Pro 的出現(xiàn),搭建起了虛擬世界和現(xiàn)實(shí)世界的橋梁,而 Sora 模型的出現(xiàn),則又為 Vision Pro 的落地可能性添加了更多火花。怎么看待Vision Pro + Sora 的結(jié)合?一起來看看本文的解讀與分享。
今年2月份兩個(gè)產(chǎn)品的發(fā)布,在2024新年一開年扔出了王炸,一個(gè)是2024年2月2日的 蘋果公司 Vision pro頭顯發(fā)布,另外一個(gè)是同年2月16日 Open AI 發(fā)布的Sora 文生視頻的虛擬世界模擬器生成模型,我們來看下兩個(gè)王炸產(chǎn)品碰撞在一起,會激發(fā)出什么樣的火花?
一、Vision pro——新時(shí)代的空間計(jì)算機(jī)
蘋果Vision pro剛剛發(fā)布,一躍成為迄今最先進(jìn)的虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)眼鏡,蘋果公司將其稱為“空間計(jì)算機(jī)”,OpenAI的創(chuàng)始人兼首席執(zhí)行官山姆·奧特曼評價(jià):蘋果Vision pro是自iPhone以后第二驚艷的技術(shù)。 實(shí)際上手體驗(yàn)時(shí),當(dāng)你帶上眼睛后,沉浸式呈現(xiàn)眼前是一個(gè)虛擬空間,它以高分辨率屏幕,支持重放事件和人物的三維視頻錄像,看起來就像置身其中,只需要通過簡單的眼神和隔空手勢操作。
1. Vision pro 定位:打通虛擬世界與現(xiàn)實(shí)世界的橋梁,呈現(xiàn)虛擬世界的載體
Vision pro出現(xiàn)讓空間計(jì)算這個(gè)詞得到現(xiàn)實(shí)中完美呈現(xiàn),簡單說將我們周圍的現(xiàn)實(shí)物理世界和虛擬世界無縫整合,同時(shí)讓人類可以實(shí)現(xiàn)毫無違和感地操控物體和空間,提供了一種全新的互動體驗(yàn)。
再夸張一些,在Vision pro搭建世界中,將虛擬和物理世界融為一體了,不論是一輛汽車還是一臺電視,都將成為空間計(jì)算設(shè)備。
通過Vision pro強(qiáng)大的空間計(jì)算能力,可以用戶提供高清晰度、強(qiáng)互動性的沉浸式風(fēng)景展現(xiàn):置身于月球登陸,探索南極洲冰川。
2. Vision pro現(xiàn)階段瓶頸——沉浸式體驗(yàn)資源生產(chǎn)匱乏
雖然Vision pro在技術(shù)和體驗(yàn)上實(shí)現(xiàn)了重大突破,但仍存在諸多不足,需要進(jìn)一步完善和優(yōu)化。比如在于虛擬世界的搭建上和3D電影 沉浸式影片照片體驗(yàn),現(xiàn)階段都是基于VisionPro頭顯專用流媒體資源(至今為止可以訪問僅150 深度的3D娛樂項(xiàng)目),且需要依賴于強(qiáng)大的虛擬世界搭建引擎和海量可支持3D的視頻模型資源,哪怕是內(nèi)置的3D攝像頭可以拍攝照片或視頻,但也需要用戶自主去捕捉拍攝,才能實(shí)現(xiàn)進(jìn)一步呈現(xiàn)。
而這一切的資源限制,隨著OpenAI Sora近期發(fā)布,讓一切限制有了突破的可能性。
二、Sora 發(fā)布——虛擬新世界的創(chuàng)造引擎
如果說Vision pro 頭顯是開啟新世界大門的鑰匙,那么Sora可以理解為虛擬新世界的創(chuàng)造引擎,所有呈現(xiàn)的內(nèi)容在未來都可以由Sora來制作且呈現(xiàn)在使用者眼前。
眾所周知,視頻是不能P的這個(gè)定律,也隨著sora的發(fā)布被打破了。
Sora 不僅僅是一個(gè)文生視頻的軟件,而是 作為世界模擬器的視頻生成模型”,“他并不是僅僅對于現(xiàn)實(shí)世界的鏡像,而是基于你的描述,構(gòu)建新的一個(gè)符合現(xiàn)實(shí)世界物理規(guī)律和運(yùn)轉(zhuǎn)虛擬世界,第一次AI可以理解這個(gè)世界的定義,并且基于這些世界運(yùn)轉(zhuǎn)規(guī)律再進(jìn)行二次創(chuàng)造。
1. Vision pro 與sora 結(jié)合——創(chuàng)造一個(gè)更加有趣的虛擬世界
Vision pro 頭顯顯示技術(shù)呈現(xiàn)的是一個(gè)與現(xiàn)實(shí)結(jié)合的虛擬空間,背后是基于現(xiàn)有的流媒體素材進(jìn)行3D化改造,但當(dāng)虛擬3D流媒體素材視頻不再是拘泥于現(xiàn)有的視頻素材,是可以通過你的描述由Sora 自定義生成新的視頻呢?
過去Vision pro 里搭建的3D媒體資源可以理解為是在一片魚塘里尋找合適的魚來匹配呈現(xiàn),Sora的出現(xiàn)將整個(gè)魚塘規(guī)模成幾何倍擴(kuò)大,可能是一整個(gè)海洋,甚至超越整個(gè)海洋的容量,通過這樣大的資源庫進(jìn)行快速生成,不再受限于已有資源的限制,對于Vision pro來講,用戶使用和發(fā)揮的空間被放大到最大化。
大膽想象下,你可以通過自己的口述,讓Sora 虛擬世界技術(shù)在Vision pro里搭建自己的新世界。甚至可以將夢中的畫面口述出來,讓sora幫你還原夢中1:1虛擬景象 ,通過Vision pro 呈現(xiàn)出來夢中的景象,在沉浸式技術(shù)的加持下,你自己就真實(shí)置身于自己搭建的虛幻世界中,參與其中,你還能分清虛擬和現(xiàn)實(shí)世界的差異性嗎?
2. Vision pro 與sora結(jié)合不僅在于3D視頻資源供給,而是打破了信息傳遞的介質(zhì)
過去我們希望將腦海中的想法表達(dá)出來,需要通過自己將大腦中想法轉(zhuǎn)化為其他人可理解的文字,圖片,形狀,盡可能降低折損傳遞,但無論如何都很難完美的呈現(xiàn)。
但通過Vision pro 與sora結(jié)合,你可以將你的想法通過口述方式傳遞給sora,由sora去生產(chǎn)還原你腦海中的想法,并支持可視化的在線編輯修改,最后由Vision pro 完美無損呈現(xiàn)你的可視化想法,完全不需要進(jìn)行更多折損的轉(zhuǎn)化路徑。
3. 顛覆未來工作方式和生活方式
未來在公司宣講或者講課,開會等場景,大家可以想象下,呈現(xiàn)在我們面前的不再在是一個(gè)枯燥單調(diào)的word/ppt方案,而是一個(gè)通過聲音和畫面以及感知觸摸方式進(jìn)行交互的虛擬可視化方案,你不再是方案的旁觀者,而是作為方案中的參與者去呈現(xiàn),直接顛覆了未來的工作和生活方式。
如果再結(jié)合未來馬斯克腦接口的神經(jīng)連接實(shí)現(xiàn),甚至省去口述的步驟,所想及所得,阿凡達(dá)的虛擬世界在未來真的有望實(shí)現(xiàn)。
未來每個(gè)人都可以擁有一個(gè)像科幻電影鋼鐵俠中屬于自己賈維斯。
其實(shí)openAI已經(jīng)為蘋果Vision pro帶來了ChatGPT,允許用戶直接在應(yīng)用程序中提出問題,獲得答案,獲得建議,甚至生成圖像和文本。在不久的將來,我們將不再需要在聊天界面中輸入信息,而是更頻繁地通過與AI助手應(yīng)用對話來表達(dá)我們的需求。
未來引入Sora的助力后,Vision pro呈現(xiàn)回答的方式會更加立體直觀,比如遇到一個(gè)比較棘手的問題,如汽車引擎無法啟動的故障,sora會自動生成一個(gè)汽車的拆解3D影響。一步步教你如何解決問題。
三、總結(jié)
雖然現(xiàn)階段無論是Vision pro還是Sora仍有很多不足,包括被大家詬病的Vision pro尿袋設(shè)計(jì),以及頭顯的太重的問題,Sora生成視頻中也有一些違背自然規(guī)律翻車內(nèi)容,也還未實(shí)現(xiàn)3D 顯式建模。但隨著科技的快速發(fā)展,按照目前迭代速度和算法持續(xù)優(yōu)化,這些問題在不久將來一定可以解決。
我們要將眼光放長遠(yuǎn)一些,未來10年,甚至3-5年后再看這些產(chǎn)品,會發(fā)展的非常成熟和完善。不要忘了僅1年時(shí)間,Open AI就已經(jīng)從GPT3-GPT4-迭代到Sora,放在過去完全不敢想象的進(jìn)步, 技術(shù)的突飛猛進(jìn)速度已遠(yuǎn)超出我們的預(yù)期和想象 ,所以科幻走進(jìn)現(xiàn)實(shí),只是早晚的事情。
Sora生成的視頻截圖。提示詞:打印一個(gè)人跑步的場景,35 毫米電影膠片。
庫克對Vision pro的希望是“定義下一個(gè)十年”,而生成式AI恰巧會在接下來的10年時(shí)間內(nèi)快速發(fā)展。據(jù)彭博社最新報(bào)告顯示,預(yù)計(jì)生成式AI市場規(guī)模將會在2032年擴(kuò)大至1.3萬億美元。需要知道,2022年生成式AI的市場規(guī)模不過400億美元,連1.3萬億美元的零頭都不到。
如果說Vision pro能夠搭上生成式AI這輛車,那么在接下來的10年時(shí)間里必定會成為蘋果又一劃時(shí)代的產(chǎn)品,而Sora和Vision pro的結(jié)合對于雙方都是很好的補(bǔ)充,在虛擬和現(xiàn)實(shí)世界之間已經(jīng)建立了一個(gè)鏈接,這讓無論是頭號玩家式的虛擬世界,還是機(jī)器人更像人類,都充滿了更大的可能性。
本文由 @黑人阿貍 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自蘋果官網(wǎng)截圖
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!