主動(dòng)式AI,將成為智能手機(jī)以及AR眼鏡發(fā)展的岔路口

0 評(píng)論 112 瀏覽 0 收藏 15 分鐘

在硬件迭代趨緩、形態(tài)創(chuàng)新逼近物理極限的今天,手機(jī)與 AR 眼鏡的下一步究竟該往哪兒走?當(dāng)“算力+傳感器”已卷無(wú)可卷,一條看不見(jiàn)的岔路悄然浮現(xiàn)——它不在屏幕大小,也不在鏡片厚薄,而在于設(shè)備是否擁有一顆“主動(dòng)”的大腦:會(huì)提前感知、會(huì)替你做決策、會(huì)讓你忘記交互的存在。主動(dòng)式 AI,正在把“工具”變?yōu)椤胺稚怼保矊⒊蔀闆Q定智能手機(jī)與 AR 眼鏡誰(shuí)能邁入下一紀(jì)元的分水嶺。

目前正處于AR眼鏡爆發(fā)前夜,很多人都在探索所謂的殺手級(jí)應(yīng)用是什么,并且對(duì)于答案也眾說(shuō)紛紜:虛實(shí)結(jié)合、3D觀影、新的生活場(chǎng)景、AI助理、導(dǎo)航、翻譯……

現(xiàn)如今,得益于AI模型能力的提升,部分初創(chuàng)企業(yè)乃至科技巨頭給出了全新的答案:那便是主動(dòng)式AI(Proactive AI/Agentic AI)。?從生活相機(jī)談起,有人味的AI究竟是什么?

近期,前美團(tuán)硬件負(fù)責(zé)人孫洋所創(chuàng)辦的硬件公司Looki發(fā)布了其首款硬件產(chǎn)品Looki L1,該產(chǎn)品引起了廣泛關(guān)注。Looki L1是一款吊墜式相機(jī),起售價(jià)199美元,它主要用于記錄用戶(hù)一天生活并自動(dòng)剪輯出vlog。

在此基礎(chǔ)之上,團(tuán)隊(duì)還在為其開(kāi)發(fā)一些主動(dòng)式AI能力,如它能主動(dòng)識(shí)別食物卡路里并告知用戶(hù),提醒瑜伽訓(xùn)練動(dòng)作是否標(biāo)準(zhǔn)等。

孫洋表示,很多AI硬件的AI功能其實(shí)手機(jī)也可以做到,但是里面涉及到一個(gè)主動(dòng)被動(dòng)的關(guān)系,比如我們可以通過(guò)手機(jī)主動(dòng)使用AI翻譯功能,相對(duì)而言AI則是被動(dòng)的?!拔覀兤谕軌蚋淖冞@一狀況,讓AI變得主動(dòng),而人則保持被動(dòng)。因?yàn)樵谖锢硎澜缰校祟?lèi)本質(zhì)上是被動(dòng)的生物?!?/p>

Looki L1就像是一個(gè)超級(jí)傻瓜式相機(jī),它無(wú)需按快門(mén),能自動(dòng)幫你記錄生活,并且也像一個(gè)私人管家,關(guān)鍵時(shí)候能給予一些生活幫助?;蛟S正是其獨(dú)特的產(chǎn)品理念,Looki成為了資本市場(chǎng)的寵兒,成立短短一年內(nèi)便拿到了三輪融資,金額超千萬(wàn)美金。

這里,我們可以先對(duì)于主動(dòng)式AI做一個(gè)簡(jiǎn)單定義:它與傳統(tǒng)的被動(dòng)式AI不同,是一種不依賴(lài)用戶(hù)明確指令,而是基于上下文、環(huán)境感知和預(yù)測(cè)來(lái)提前采取行動(dòng)或給出建議的人工智能。主動(dòng)式AI能夠預(yù)判用戶(hù)需求,并主動(dòng)執(zhí)行相關(guān)任務(wù),它在概念上比較接近市場(chǎng)上熱議的Agentic AI。

話(huà)說(shuō)回來(lái),主動(dòng)式AI也是今年AI行業(yè)的重要探索方向,甚至業(yè)內(nèi)將2025年稱(chēng)之為Agent落地元年。自2022年ChatGPT發(fā)布,短短數(shù)年時(shí)間AI模型能力有了巨大提升,它能像真人一樣聊天,可以生成圖片/視頻甚至游戲,已經(jīng)滲透到生活的很多方面。不過(guò)在這之前,它仍依賴(lài)于關(guān)鍵詞指令,到了現(xiàn)在,隨著一系列標(biāo)準(zhǔn)化協(xié)議以及Agent編排框架的逐漸成熟,主動(dòng)式AI的苗頭已經(jīng)越來(lái)越明顯。

數(shù)據(jù)機(jī)構(gòu)Gartner曾預(yù)測(cè),到2028年,至少15%的日常工作決策將通過(guò)Agentic AI自主做出,而2024年這一比例為0%。此外,到2028年,33%的企業(yè)軟件應(yīng)用程序?qū)珹gentic AI,而2024年這一比例還不到1%。

除了前面所提到的Looki外,近期谷歌所發(fā)布的最新的Pixel 10系列手機(jī),也對(duì)它的主動(dòng)式AI功能(Magic Cue)做了重點(diǎn)宣傳,目前它能實(shí)現(xiàn)以下主要功能:

旅行場(chǎng)景:當(dāng)用戶(hù)致電航空公司更改座位,Magic Cue會(huì)自動(dòng)調(diào)出郵件的航班座位號(hào)信息并顯示在前臺(tái),方便用戶(hù)溝通;

訂餐場(chǎng)景:用戶(hù)的好友詢(xún)問(wèn)晚餐預(yù)定信息時(shí),Magic Cue會(huì)從地圖、日歷等APP中調(diào)出相應(yīng)的地點(diǎn)以及時(shí)間信息;

查找圖片:聊天時(shí)好友提到某張?zhí)囟ㄕ掌?,?dāng)用戶(hù)想要分享圖片時(shí),Magic Cue會(huì)率先幫你找到這張照片。

圖源:谷歌

為什么說(shuō)眼鏡才是主動(dòng)式AI的更佳硬件載體?

為了讓AI發(fā)揮更大的“主觀能動(dòng)性”,背后離不開(kāi)兩大要素:一是Agent足夠智能,能夠“理解”用戶(hù)所發(fā)生的事情并知道其中關(guān)聯(lián);二是能夠?qū)τ脩?hù)有足夠洞察,即AI需要與我們的生活貼近,了解我們的個(gè)性化偏好以及所經(jīng)歷的事情。前者考驗(yàn)的是AI模型能力,后者則依賴(lài)于隨身硬件。

硬件方面,智能手機(jī)等產(chǎn)品對(duì)于主動(dòng)式AI而言已經(jīng)顯得有點(diǎn)力不從心,因?yàn)樗芏鄷r(shí)候只是放在我們口袋,它們無(wú)法真正感知到用戶(hù)在現(xiàn)實(shí)環(huán)境中所發(fā)生的事情。孫洋透露,美團(tuán)曾試圖開(kāi)發(fā)一個(gè)AI外賣(mài)助手以更好向用戶(hù)推薦美食,但是最終團(tuán)隊(duì)發(fā)現(xiàn),背后的阻礙并非模型能力而是硬件。“模型上知天文下知地理,但是不知道你今天有沒(méi)有喝水?!?/p>

這意味著,個(gè)性化的主動(dòng)式AI,需要新的硬件終端出現(xiàn),而這個(gè)硬件終端,很可能是AR眼鏡等新形態(tài)產(chǎn)品。展開(kāi)來(lái)看,主動(dòng)式AI可能會(huì)在非特定時(shí)間、場(chǎng)合提供一些幫助,比如在聊天時(shí)解釋某個(gè)陌生單詞的意思,在路上你突然好奇眼前建筑的歷史等,它要求設(shè)備能夠時(shí)刻待命。AR屬于近眼顯示設(shè)備,可以很方便呈現(xiàn)這些內(nèi)容。

其次,主動(dòng)式AI需要捕獲足夠多的上下文信息,這是提供個(gè)性化幫助的必要基礎(chǔ)。恰好AR眼鏡屬于一個(gè)隨身設(shè)備,能看我所看,聽(tīng)我所聽(tīng),它就是我們生活的親歷者,具有其他產(chǎn)品所不具備的洞察能力。值得一提的是,Looki團(tuán)隊(duì)最開(kāi)始所考慮的就是智能眼鏡形態(tài),不過(guò)受限于供應(yīng)鏈能力不成熟,最終采用了吊墜相機(jī)方案。

主動(dòng)式AI需要智能眼鏡等全新硬件才能獲得完美體驗(yàn),反過(guò)來(lái)看,對(duì)于AR眼鏡而言,主動(dòng)式AI很可能會(huì)成為其獨(dú)一無(wú)二的殺手級(jí)應(yīng)用場(chǎng)景。目前市場(chǎng)上已經(jīng)有兩家AR廠商開(kāi)始關(guān)注并開(kāi)發(fā)主動(dòng)式AI功能,其中包括開(kāi)放式AR眼鏡系統(tǒng)MentraOS,以及今年熱門(mén)AR眼鏡品牌Halliday。

去年7月,MentraOS團(tuán)隊(duì)負(fù)責(zé)人Cayden Pierce曾在一次演講中曾提到了對(duì)于智能眼鏡應(yīng)用場(chǎng)景的看法。他指出,目前很多開(kāi)發(fā)者或者企業(yè)在做智能眼鏡功能演示時(shí)仍停留在查看天氣、發(fā)送郵件等,而這些功能只不過(guò)是手機(jī)的單調(diào)重復(fù)。

“為了讓智能眼鏡發(fā)揮100倍的實(shí)用性,我們需要一種全新的應(yīng)用程序,它是情境化、主動(dòng)化以及智能化的。這個(gè)主動(dòng)式系統(tǒng)不僅僅在你要求它做某事時(shí)才給予反應(yīng),并且,它還會(huì)根據(jù)你的具體情況,判斷它能做什么?!?/p>

在演講中,Cayden Pierce同樣提到了不少關(guān)于主動(dòng)式AI的潛在用例:

凌晨你在一個(gè)陌生城市落機(jī),此時(shí)的你已經(jīng)疲憊不堪只想打車(chē)到預(yù)定的酒店休息。在以往情況下,你需要逐個(gè)打開(kāi)手機(jī)的地圖、打車(chē)、旅行等軟件從而完成這個(gè)簡(jiǎn)單的任務(wù)。主動(dòng)式AI出現(xiàn)后,將會(huì)幫你無(wú)痛完成整個(gè)過(guò)程;

你與朋友閑聊時(shí),有時(shí)候會(huì)在某些問(wèn)題上出現(xiàn)爭(zhēng)執(zhí),如某種食物熱量、某個(gè)城市所在位置等,AI在你談話(huà)期間會(huì)主動(dòng)檢索這些對(duì)用戶(hù)有用的信息并在屏幕上顯示出來(lái);

逛商場(chǎng)時(shí),主動(dòng)式AI能夠針對(duì)性地展示對(duì)用戶(hù)有用的信息,比如會(huì)重點(diǎn)標(biāo)注用戶(hù)感興趣的門(mén)店并展示評(píng)分、促銷(xiāo)商品等。

現(xiàn)如今,MentraOS團(tuán)隊(duì)已經(jīng)開(kāi)發(fā)出了一個(gè)名為Merge的主動(dòng)式AI功能,介紹指出它能“在對(duì)話(huà)中通過(guò)自動(dòng)提供有用信息(如回答和事實(shí)核查)來(lái)幫助你?!?/p>

無(wú)獨(dú)有偶,Halliday眼鏡也將主動(dòng)式AI功能作為產(chǎn)品重要賣(mài)點(diǎn),宣傳資料指出:“它可以聆聽(tīng)對(duì)話(huà)并提供基于上下文的建議和信息支持,從而增強(qiáng)討論、采訪和商務(wù)會(huì)議的效果?!?/p>

圖源:Halliday

更加好用的主動(dòng)式AI:數(shù)據(jù)以及注意力問(wèn)題

從長(zhǎng)遠(yuǎn)來(lái)看,主動(dòng)式AI或許會(huì)跟自動(dòng)駕駛一樣,分為L(zhǎng)0、L1……L5等不同等級(jí),當(dāng)前主動(dòng)式AI體驗(yàn)依然十分薄弱,只能幫我們處理詞義分析、郵件/備忘錄提醒等簡(jiǎn)單任務(wù)。朝著更高階能力邁進(jìn)過(guò)程中,主動(dòng)式AI仍需要解決以下挑戰(zhàn):

1、AI是否具備足夠多的數(shù)據(jù)權(quán)限。以Magic Cue為例,AI功能的整合仍只局限在谷歌的生態(tài)里面,比如Gmail、Calendar、Google Maps、Messages等,其他第三方應(yīng)用的信息難以獲取,這使得它的能力仍有很大局限。對(duì)于AR眼鏡而言,想要打通現(xiàn)有的移動(dòng)互聯(lián)網(wǎng)生態(tài)并不容易。

2、如何準(zhǔn)確識(shí)別用戶(hù)意圖并給予用戶(hù)想要的幫助。教研機(jī)構(gòu)The Synteraction Lab的學(xué)子曾開(kāi)發(fā)了一款主動(dòng)式AI助手AiGet,它能結(jié)合多模態(tài)AI給用戶(hù)分享一些現(xiàn)實(shí)生活的小知識(shí),比如眼前的花朵名稱(chēng)、寵物的一些特殊習(xí)性等。在應(yīng)用開(kāi)發(fā)過(guò)程中,團(tuán)隊(duì)透露了他們的兩大難點(diǎn):一、用戶(hù)的偏好不明確,你無(wú)法知道用戶(hù)究竟更青睞植物知識(shí)還是地理環(huán)境知識(shí);二是內(nèi)容的推送要恰到好處,否則可能會(huì)干擾用戶(hù)的主要任務(wù)。

圖源:The Synteraction Lab

3、隱私問(wèn)題。這里面其實(shí)存在一個(gè)悖論,AI越強(qiáng)大,那么它就需要獲取更多用戶(hù)數(shù)據(jù),隱私風(fēng)險(xiǎn)也就越高。對(duì)于智能眼鏡,目前尚未看到有廠商主動(dòng)強(qiáng)調(diào)主動(dòng)式AI的隱私保護(hù)問(wèn)題。而谷歌曾透露,Magic Cue只會(huì)在設(shè)備端進(jìn)行,背后依賴(lài)于Gemini Nano V3模型以及Tensor G5芯片的本地處理能力。

4、受到續(xù)航、散熱等硬件限制,主動(dòng)式AI仍難以保持全天在線。如Looki L1,該產(chǎn)品其實(shí)不會(huì)全天候記錄用戶(hù)的生活畫(huà)面,相反,它采用了記錄切片的運(yùn)行方式,如三分鐘記錄15秒的短視頻。另外,無(wú)論是MentraOS亦或是Halliday,眼鏡的主動(dòng)式AI均不是系統(tǒng)級(jí)功能,它需要主動(dòng)打開(kāi)才能使用,并且它們只支持麥克風(fēng)監(jiān)聽(tīng)這一基礎(chǔ)能力,尚不支持多模態(tài)。

總的來(lái)看,目前主動(dòng)式AI在各行業(yè)中的應(yīng)用仍處于初步萌芽的階段,但是未來(lái)可期,如果說(shuō)鋼鐵俠的賈維斯在未來(lái)某一刻出現(xiàn),那它很可能會(huì)作為殺手級(jí)應(yīng)用率先在眼鏡端落地。

此前市場(chǎng)上很多人都在探討未來(lái)手機(jī)與AR眼鏡的關(guān)系,筆者認(rèn)為,兩者會(huì)長(zhǎng)期共存,但兩者之間可能會(huì)因?yàn)椤爸鲃?dòng)式AI”功能劃分出一條涇渭分明的界限:手機(jī)計(jì)算平臺(tái)的地位不變,但后續(xù)它更多聚焦于多樣化的應(yīng)用生態(tài)數(shù)據(jù)整合,如常規(guī)網(wǎng)絡(luò)購(gòu)物、社交、游戲娛樂(lè)等;而AR眼鏡則聚焦于即刻以及現(xiàn)實(shí)的響應(yīng),并通過(guò)AI給予用戶(hù)更加個(gè)性化的生活服務(wù)。

因而,主動(dòng)式AI,或許會(huì)是科技發(fā)展之路上的一大岔路口,它將讓AR眼鏡賽道變得熠熠生輝并且充滿(mǎn)獨(dú)特價(jià)值。讓我們期待在隨后數(shù)年中該功能的持續(xù)躍遷。

文/VR陀螺 萬(wàn)里

本文由人人都是產(chǎn)品經(jīng)理作者【VR陀螺】,微信公眾號(hào):【VR陀螺】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!