AR眼鏡AI用例盤點:從單薄的功能一窺廣闊的生命力

0 評論 1868 瀏覽 3 收藏 16 分鐘

AI與各類產(chǎn)品的融合速度正在加快,對于AR或者其他設(shè)備而言,AI功能的加入也成為了一個不小的賣點。那么,目前AR眼鏡上有哪些主流AI功能?未來的眼鏡終端還將如何發(fā)展?本文做了一定的盤點和分析,一起來看一下。

今年Connect大會上,扎克伯格拋出了一個有意思的話題:“讓我特別感興趣的一個領(lǐng)域是,如何將AI的進步與下一代計算平臺相結(jié)合?!?/p>

伴隨著因ChatGPT爆火而引發(fā)的新一輪熱潮,AI開始加速與千行百業(yè)融合,如今年三月微軟宣布將GPT接入Office辦公套件,谷歌將其AI助手Bard集成到谷歌日歷等應(yīng)用全家桶中等。

同樣,對于AR或者是其他可穿戴式設(shè)備而言,AI也成為了其不可或缺的賣點之一。本文將對目前AR眼鏡上的主流AI功能進行盤點,一窺技術(shù)發(fā)展趨勢。

以AI驅(qū)動的可穿戴式設(shè)備,圖源:Humane

一、Meta AI引入智能眼鏡;ARKnovv A1支持AI三件套

早在GPT爆火之前,VR、AR產(chǎn)品中已經(jīng)出現(xiàn)了很多有關(guān)AI的用例,如結(jié)合了AI算法的手勢識別、基于AI預(yù)測用戶的全身追蹤等。不過這些功能多停留在用戶無法直接感知的隱性層面?,F(xiàn)如今隨著LLM、AIGC等技術(shù)的發(fā)展,AI進一步走到了臺前。

以Meta最近發(fā)布的新一代智能眼鏡產(chǎn)品Ray-Ban Meta為例,它與老款產(chǎn)品比較重要的差異點在于,產(chǎn)品正式實現(xiàn)了對Meta AI的支持。

Meta官網(wǎng)指出,Meta AI由Llama 2大模型驅(qū)動,并與微軟Bing搜索引擎達成了合作,目前已經(jīng)可以通過Instagram、WhatsApp等Meta社交平臺進行訪問。

今年Meta Connect期間,扎克伯格對于Meta AI進行了演示(基于其社交APP),Meta AI具備很強的上下文理解能力,可以快速響應(yīng)用戶的各種提問。此外,它還集成了Meta的AI圖像生成工具Emu,可以基于用戶的需求生成相應(yīng)的圖片。

圖源:Meta

除應(yīng)用于自家社交平臺,Meta AI還搭載到了自家的硬件產(chǎn)品Ray-Ban Meta中。由于Ray-Ban Meta并沒有配備屏幕,所以只能以語音的方式輸出,這使得它并不能承擔(dān)太多復(fù)雜的工作?;诎l(fā)布會演示,Meta AI的作用主要體現(xiàn)在兩方面:一是偏向于功能交互的場景,如通過語音命令拍攝照片,通過語音將圖片視頻分享到Messenger等;二是充當一個類似于ChatGPT式的AI助手的角色,用戶可以與之進行閑聊、詢問出行建議等。

除Meta AI外,扎克伯格透露明年將會為Ray-Ban Meta新增更多AI的能力,如用戶在旅游時可以通過AI詢問眼前建筑的具體信息;協(xié)助翻譯外語廣告牌上面的內(nèi)容、詢問水龍頭的一些維修建議等。

Ray-Ban Meta AI功能的落地離不開新處理器驍龍AR1 Gen1的應(yīng)用,據(jù)了解,該處理器可實現(xiàn)眼鏡側(cè)AI,這使得硬件廠商可以在眼鏡中接入系列AI模型。高通官網(wǎng)指出,驍龍AR1 Gen1搭載了第三代Hexagon NPU和用于視覺分析的AR級引擎,可用于增強圖像和音頻質(zhì)量、視覺搜索、實時翻譯等。

近日,雷鳥創(chuàng)新官宣了其下一代AR眼鏡新品雷鳥 X2 Lite,產(chǎn)品同樣搭載驍龍AR1 Gen1,具備更強的AI能力也是產(chǎn)品的重要賣點之一,產(chǎn)品可實現(xiàn)實時翻譯、智能出行建議等AI功能。

圖源:Meta

除Ray-Ban Meta以及雷鳥X2 Lite,今年以來發(fā)布的大多數(shù)AR眼鏡產(chǎn)品均配備了AI相關(guān)能力,比較典型的是致敬未知于今年7月發(fā)布的ARKnovv A1。致敬未知創(chuàng)始人吳德周曾表示,“AI和AR的結(jié)合一定是方向,我們希望能夠深度結(jié)合AI,讓AR眼鏡真正能夠成為更有效率、更好玩的工具?!?/p>

產(chǎn)品定位方面,ARKnovv A1與Ray-Ban Meta有較大不同,前者采用分體式設(shè)計,但是補充了雙目Micro-OLED屏幕。此外,前者配備了單目攝像頭,但并不聚焦于拍照攝影,而是用于實現(xiàn)SLAM等相關(guān)玩法。

在AI功能方面,ARKnovv A1分為了三大塊:基于AI大模型驅(qū)動的語音助手、借助攝像頭以及CV實現(xiàn)的現(xiàn)實大爆炸(可識別建筑物、植物、餐廳等)以及基于開源繪圖大模型Stable Diffution打造的AI圖生圖功能。

圖源:致敬未知

近日,李未可CEO茹憶公布了其下一代AR眼鏡李未可Meta Lens S3。茹憶認為,當下AI在交互計算平臺領(lǐng)域的重要性越來越突出,AI交互能力將成為AR眼鏡的核心能力。

產(chǎn)品方面,李未可團隊正在將AI大模型深度整合到AR眼鏡中,AI模型采用“重云輕端 云端一體”的搭建模式,云端構(gòu)建以認知、推理、服務(wù)、任務(wù)等模型為基礎(chǔ)的AI大腦,并實時響應(yīng)AR終端的用戶需求。

二、除增強現(xiàn)實、AI如何賦能產(chǎn)品構(gòu)建更前沿的生活方式

可以發(fā)現(xiàn),如何結(jié)合AI為用戶提供更加高頻更加有趣的玩法已經(jīng)變成了如今AR/智能眼鏡產(chǎn)品所探討的重要議題。不過由于產(chǎn)品多聚焦于大眾消費市場,使得功能也相對趨同,當然也有廠商試圖從中挖掘更加垂直化的用例。

如海外企業(yè)Envision專門面向視障群體開發(fā)了一款眼鏡產(chǎn)品Envision Glasses。該產(chǎn)品基于Google Glass Enterprise 2開發(fā)而來,產(chǎn)品搭載驍龍XR1,配備800萬像素攝像頭。由于產(chǎn)品面向視障群體,它更依賴于AI所支撐的環(huán)境感知以及理解能力,而屏幕或者AR反倒成為了無關(guān)緊要的功能。

以下是Envision Glasses所對外展示的一系列用例:

  • 可以掃描書籍、信件等手寫或印刷文本信息并通過語音的方式向用戶播報,它可識別超過60種語言;
  • 借助攝像頭進行第一視角的通話;
  • 從一堆白色的衣服中挑出紅色的襪子,判斷室內(nèi)的燈是否亮著;
  • 識別親人朋友等,提醒用戶打招呼。

圖源:Envision

值得一提的是,Envision的前身是一家OCR和物體識別應(yīng)用開發(fā)商,2017年,企業(yè)上線《Envision AI》APP,該APP同樣瞄準了視障群體。Envision Glasses需要搭配其手機APP使用,官網(wǎng)指出眼鏡在正常情況下可提供約5-6小時的使用時長。

圖源:Envision

扎克伯格曾表示眼鏡將會是AI最佳的硬件載體之一,因為眼鏡能夠見你所見、聽你所聽,很好洞悉用戶的一切。不過,這并不只是當前的唯一解。

今年9月底,The Information爆料稱,OpenAI CEO Sam Altman、軟銀集團CEO孫正義與前蘋果首席設(shè)計師Jony Ive進行了洽談,三方或?qū)⒊闪⒁患覍W⒂谘邪l(fā)新一代AI硬件的新公司,不過對于AI時代下的新硬件究竟會是什么樣子,目前他們?nèi)詻]有達成共識。

10月中旬的WSJ公開采訪中,Altman曾表示AI 時代下計算機可以獨立思考,所以什么樣的硬件都有可能,它或許是新一代手機、或許是智能音箱、甚至有可能是某種AI驅(qū)動的機器人。不過外界猜測稱,關(guān)于前沿AI硬件最佳實踐或許正是Altman曾多次投資的科技企業(yè)Humane。

Humane團隊打造了一款A(yù)I投影設(shè)備AI Pin,設(shè)備體積小巧,可像一枚胸針一樣掛于胸前。該產(chǎn)品集成了無喚醒詞的AI助手,除此之外,AI Pin內(nèi)置了一個投影模組,它可將一些來電聯(lián)系人等簡單的信息投射于手掌中。

據(jù)了解,Ai Pin將會搭載專用系統(tǒng),甚至有可能會結(jié)合OpenAI的GPT-4,基于過往的一些案例,用戶可以向設(shè)備發(fā)送撥號指令、詢問就餐建議、旅行安排、檢測食物卡路里等。此外,Ai Pin的AI助手還將具備一定的上下文聯(lián)系能力。

其他方面,Ai Pin售價可能會高達1000美元,配備高通驍龍芯片,性能可以比肩智能手機。此前該產(chǎn)品已經(jīng)在9月底的巴黎時裝秀上有所亮相,并即將于11月9日召開新品發(fā)布會。更多信息可查看VR陀螺過往文章《iPhone核心團隊成員創(chuàng)業(yè),融資2.3億美元,要做“另類”下一代計算平臺》。

圖源:Humane

三、AI持續(xù)進化,未來眼鏡終端還將如何發(fā)展?

目前AR眼鏡/智能穿戴仍處于探索期,而AI如何與新一代計算終端所結(jié)合也同樣如此?;谇懊娴囊恍┯布K端其實也不難發(fā)現(xiàn),各家廠商對于AI的理解以及側(cè)重點會有一定差異,但是共識是AI將會在新一代計算設(shè)備革命中發(fā)揮重要用途。

對此,茹憶則提出了一個簡單明了的觀點,如果AR眼鏡是iPhone,那么AI就是iOS,即AI將成為硬件驅(qū)動的核心。

從當前來看,眼鏡產(chǎn)品上的AI用例仍多集中于基于LLM的語音助手、簡單的識圖功能等,目前體驗仍相對單薄。此外,由于隱私以及設(shè)備續(xù)航所限,設(shè)備的AI能力很多時候只能處于被動觸發(fā)狀態(tài),如只有按下按鈕或者呼出特定語音指令才能有所響應(yīng)(這有點類似于搜索與信息推送的差異)。這種單項互動在一定程度上阻礙了AI功能的黏性。

此外,根據(jù)海外平臺SparkToro調(diào)查數(shù)據(jù),聊天機器人模型ChatGPT的用戶會話中,編程協(xié)助以及教育用途最為廣泛,分別達到了29.1%和11.9%,而聊天互動等私人用途占比反而并不算高。未來,如何實現(xiàn)大語言模型與眼鏡終端更為有機的結(jié)合也是一個值得持續(xù)思考的問題。

圖源:SparkToro

其他方面,AR眼鏡的算力薄弱,目前仍以云端側(cè)AI為主。高通今年發(fā)布《混合AI是AI的未來》白皮書里面提到,云端和終端協(xié)同處理的混合AI是AI的未來,這樣才能高效推動AI規(guī)?;涞?,并發(fā)揮其最大潛能。隨著端側(cè)AI能力的增強,未來設(shè)備可以構(gòu)建更加個性化以及安全的AI助手,可以在離線狀態(tài)下工作,并且響應(yīng)速度也會更快。

而AGI(通用人工智能)是AI的下一個發(fā)展階段,AGI具備更強的感知、推理與學(xué)習(xí)能力,未來當AGI引入AR眼鏡之后,它的能力將得到更為廣泛的提升。彼時,AR眼鏡將會成為一個更加無感以及智能的設(shè)備。

高通技術(shù)公司產(chǎn)品管理高級副總裁兼AI負責(zé)人Ziad Asghar采訪中曾提到,在未來5年內(nèi),AI將會成為一個更加智能的個人助理,比如當告知設(shè)備會議要遲到了,它將能自動給相關(guān)成員發(fā)送消息。

圖源:高通

關(guān)于這一點,或許我們能在發(fā)布的Ai Pin上面看到相關(guān)解法。Humane的一份專利文件中指出設(shè)備可以結(jié)合用戶的體溫、心率等數(shù)據(jù)來估算用戶的感情狀態(tài)以及當前環(huán)境的重要性,然后會選擇是否激活麥克風(fēng)攝像頭等。它有點類似于iPhone的相冊“回憶”功能,但是設(shè)備會替用戶完成很多隱形的決策工作。

而美國未來學(xué)家Devin Liddell則認為,在AI技術(shù)的加持下,AR眼鏡將能獲得遠超普通人類的超級感官,比如眼鏡可以洞悉用戶的真實情緒、是否在撒謊等。

比爾蓋茨曾提到,人工智能革命重要程度不亞于手機和互聯(lián)網(wǎng)的誕生,這是其一生中唯二的革命性技術(shù)進步。而未來AR眼鏡/智能眼鏡在AI的加持之下,也將迸發(fā)出我們難以想象得到的創(chuàng)作力以及生命力。

參考資料:

https://mp.weixin.qq.com/s/npZduUT7FYhlqAdp3SsAiQ

https://mp.weixin.qq.com/s/XMzMACpCwjanMpyba73QVQ

作者:萬里

來源公眾號:VR陀螺(ID:vrtuoluo),XR行業(yè)垂直媒體,關(guān)注VR/AR的頭部產(chǎn)業(yè)服務(wù)平臺。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @VR陀螺 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!