主動式AI,將成為智能手機以及AR眼鏡發(fā)展的岔路口
在硬件迭代趨緩、形態(tài)創(chuàng)新逼近物理極限的今天,手機與 AR 眼鏡的下一步究竟該往哪兒走?當(dāng)“算力+傳感器”已卷無可卷,一條看不見的岔路悄然浮現(xiàn)——它不在屏幕大小,也不在鏡片厚薄,而在于設(shè)備是否擁有一顆“主動”的大腦:會提前感知、會替你做決策、會讓你忘記交互的存在。主動式 AI,正在把“工具”變?yōu)椤胺稚怼?,也將成為決定智能手機與 AR 眼鏡誰能邁入下一紀(jì)元的分水嶺。
目前正處于AR眼鏡爆發(fā)前夜,很多人都在探索所謂的殺手級應(yīng)用是什么,并且對于答案也眾說紛紜:虛實結(jié)合、3D觀影、新的生活場景、AI助理、導(dǎo)航、翻譯……
現(xiàn)如今,得益于AI模型能力的提升,部分初創(chuàng)企業(yè)乃至科技巨頭給出了全新的答案:那便是主動式AI(Proactive AI/Agentic AI)。?從生活相機談起,有人味的AI究竟是什么?
近期,前美團硬件負(fù)責(zé)人孫洋所創(chuàng)辦的硬件公司Looki發(fā)布了其首款硬件產(chǎn)品Looki L1,該產(chǎn)品引起了廣泛關(guān)注。Looki L1是一款吊墜式相機,起售價199美元,它主要用于記錄用戶一天生活并自動剪輯出vlog。
在此基礎(chǔ)之上,團隊還在為其開發(fā)一些主動式AI能力,如它能主動識別食物卡路里并告知用戶,提醒瑜伽訓(xùn)練動作是否標(biāo)準(zhǔn)等。
孫洋表示,很多AI硬件的AI功能其實手機也可以做到,但是里面涉及到一個主動被動的關(guān)系,比如我們可以通過手機主動使用AI翻譯功能,相對而言AI則是被動的。“我們期望能夠改變這一狀況,讓AI變得主動,而人則保持被動。因為在物理世界中,人類本質(zhì)上是被動的生物。”
Looki L1就像是一個超級傻瓜式相機,它無需按快門,能自動幫你記錄生活,并且也像一個私人管家,關(guān)鍵時候能給予一些生活幫助。或許正是其獨特的產(chǎn)品理念,Looki成為了資本市場的寵兒,成立短短一年內(nèi)便拿到了三輪融資,金額超千萬美金。
Looki L1,圖源:網(wǎng)絡(luò)
這里,我們可以先對于主動式AI做一個簡單定義:它與傳統(tǒng)的被動式AI不同,是一種不依賴用戶明確指令,而是基于上下文、環(huán)境感知和預(yù)測來提前采取行動或給出建議的人工智能。主動式AI能夠預(yù)判用戶需求,并主動執(zhí)行相關(guān)任務(wù),它在概念上比較接近市場上熱議的Agentic AI。
話說回來,主動式AI也是今年AI行業(yè)的重要探索方向,甚至業(yè)內(nèi)將2025年稱之為Agent落地元年。自2022年ChatGPT發(fā)布,短短數(shù)年時間AI模型能力有了巨大提升,它能像真人一樣聊天,可以生成圖片/視頻甚至游戲,已經(jīng)滲透到生活的很多方面。不過在這之前,它仍依賴于關(guān)鍵詞指令,到了現(xiàn)在,隨著一系列標(biāo)準(zhǔn)化協(xié)議以及Agent編排框架的逐漸成熟,主動式AI的苗頭已經(jīng)越來越明顯。
數(shù)據(jù)機構(gòu)Gartner曾預(yù)測,到2028年,至少15%的日常工作決策將通過Agentic AI自主做出,而2024年這一比例為0%。此外,到2028年,33%的企業(yè)軟件應(yīng)用程序?qū)珹gentic AI,而2024年這一比例還不到1%。
圖源:網(wǎng)絡(luò)
除了前面所提到的Looki外,近期谷歌所發(fā)布的最新的Pixel 10系列手機,也對它的主動式AI功能(Magic Cue)做了重點宣傳,目前它能實現(xiàn)以下主要功能:
旅行場景:當(dāng)用戶致電航空公司更改座位,Magic Cue會自動調(diào)出郵件的航班座位號信息并顯示在前臺,方便用戶溝通;
訂餐場景:用戶的好友詢問晚餐預(yù)定信息時,Magic Cue會從地圖、日歷等APP中調(diào)出相應(yīng)的地點以及時間信息;
查找圖片:聊天時好友提到某張?zhí)囟ㄕ掌?,?dāng)用戶想要分享圖片時,Magic Cue會率先幫你找到這張照片。
圖源:谷歌
為什么說眼鏡才是主動式AI的更佳硬件載體?
為了讓AI發(fā)揮更大的“主觀能動性”,背后離不開兩大要素:一是Agent足夠智能,能夠“理解”用戶所發(fā)生的事情并知道其中關(guān)聯(lián);二是能夠?qū)τ脩粲凶銐蚨床欤碅I需要與我們的生活貼近,了解我們的個性化偏好以及所經(jīng)歷的事情。前者考驗的是AI模型能力,后者則依賴于隨身硬件。
硬件方面,智能手機等產(chǎn)品對于主動式AI而言已經(jīng)顯得有點力不從心,因為它很多時候只是放在我們口袋,它們無法真正感知到用戶在現(xiàn)實環(huán)境中所發(fā)生的事情。孫洋透露,美團曾試圖開發(fā)一個AI外賣助手以更好向用戶推薦美食,但是最終團隊發(fā)現(xiàn),背后的阻礙并非模型能力而是硬件。“模型上知天文下知地理,但是不知道你今天有沒有喝水?!?/p>
這意味著,個性化的主動式AI,需要新的硬件終端出現(xiàn),而這個硬件終端,很可能是AR眼鏡等新形態(tài)產(chǎn)品。展開來看,主動式AI可能會在非特定時間、場合提供一些幫助,比如在聊天時解釋某個陌生單詞的意思,在路上你突然好奇眼前建筑的歷史等,它要求設(shè)備能夠時刻待命。AR屬于近眼顯示設(shè)備,可以很方便呈現(xiàn)這些內(nèi)容。
其次,主動式AI需要捕獲足夠多的上下文信息,這是提供個性化幫助的必要基礎(chǔ)。恰好AR眼鏡屬于一個隨身設(shè)備,能看我所看,聽我所聽,它就是我們生活的親歷者,具有其他產(chǎn)品所不具備的洞察能力。值得一提的是,Looki團隊最開始所考慮的就是智能眼鏡形態(tài),不過受限于供應(yīng)鏈能力不成熟,最終采用了吊墜相機方案。
圖源:網(wǎng)絡(luò)
主動式AI需要智能眼鏡等全新硬件才能獲得完美體驗,反過來看,對于AR眼鏡而言,主動式AI很可能會成為其獨一無二的殺手級應(yīng)用場景。目前市場上已經(jīng)有兩家AR廠商開始關(guān)注并開發(fā)主動式AI功能,其中包括開放式AR眼鏡系統(tǒng)MentraOS,以及今年熱門AR眼鏡品牌Halliday。
去年7月,MentraOS團隊負(fù)責(zé)人Cayden Pierce曾在一次演講中曾提到了對于智能眼鏡應(yīng)用場景的看法。他指出,目前很多開發(fā)者或者企業(yè)在做智能眼鏡功能演示時仍停留在查看天氣、發(fā)送郵件等,而這些功能只不過是手機的單調(diào)重復(fù)。
“為了讓智能眼鏡發(fā)揮100倍的實用性,我們需要一種全新的應(yīng)用程序,它是情境化、主動化以及智能化的。這個主動式系統(tǒng)不僅僅在你要求它做某事時才給予反應(yīng),并且,它還會根據(jù)你的具體情況,判斷它能做什么。”
在演講中,Cayden Pierce同樣提到了不少關(guān)于主動式AI的潛在用例:
凌晨你在一個陌生城市落機,此時的你已經(jīng)疲憊不堪只想打車到預(yù)定的酒店休息。在以往情況下,你需要逐個打開手機的地圖、打車、旅行等軟件從而完成這個簡單的任務(wù)。主動式AI出現(xiàn)后,將會幫你無痛完成整個過程;
你與朋友閑聊時,有時候會在某些問題上出現(xiàn)爭執(zhí),如某種食物熱量、某個城市所在位置等,AI在你談話期間會主動檢索這些對用戶有用的信息并在屏幕上顯示出來;
逛商場時,主動式AI能夠針對性地展示對用戶有用的信息,比如會重點標(biāo)注用戶感興趣的門店并展示評分、促銷商品等。
現(xiàn)如今,MentraOS團隊已經(jīng)開發(fā)出了一個名為Merge的主動式AI功能,介紹指出它能“在對話中通過自動提供有用信息(如回答和事實核查)來幫助你。”
無獨有偶,Halliday眼鏡也將主動式AI功能作為產(chǎn)品重要賣點,宣傳資料指出:“它可以聆聽對話并提供基于上下文的建議和信息支持,從而增強討論、采訪和商務(wù)會議的效果?!?/p>
圖源:Halliday
更加好用的主動式AI:數(shù)據(jù)以及注意力問題?
從長遠(yuǎn)來看,主動式AI或許會跟自動駕駛一樣,分為L0、L1……L5等不同等級,當(dāng)前主動式AI體驗依然十分薄弱,只能幫我們處理詞義分析、郵件/備忘錄提醒等簡單任務(wù)。朝著更高階能力邁進過程中,主動式AI仍需要解決以下挑戰(zhàn):
1、AI是否具備足夠多的數(shù)據(jù)權(quán)限。以Magic Cue為例,AI功能的整合仍只局限在谷歌的生態(tài)里面,比如Gmail、Calendar、Google Maps、Messages等,其他第三方應(yīng)用的信息難以獲取,這使得它的能力仍有很大局限。對于AR眼鏡而言,想要打通現(xiàn)有的移動互聯(lián)網(wǎng)生態(tài)并不容易。
2、如何準(zhǔn)確識別用戶意圖并給予用戶想要的幫助。教研機構(gòu)The Synteraction Lab的學(xué)子曾開發(fā)了一款主動式AI助手AiGet,它能結(jié)合多模態(tài)AI給用戶分享一些現(xiàn)實生活的小知識,比如眼前的花朵名稱、寵物的一些特殊習(xí)性等。在應(yīng)用開發(fā)過程中,團隊透露了他們的兩大難點:一、用戶的偏好不明確,你無法知道用戶究竟更青睞植物知識還是地理環(huán)境知識;二是內(nèi)容的推送要恰到好處,否則可能會干擾用戶的主要任務(wù)。
圖源:The Synteraction Lab
3、隱私問題。這里面其實存在一個悖論,AI越強大,那么它就需要獲取更多用戶數(shù)據(jù),隱私風(fēng)險也就越高。對于智能眼鏡,目前尚未看到有廠商主動強調(diào)主動式AI的隱私保護問題。而谷歌曾透露,Magic Cue只會在設(shè)備端進行,背后依賴于Gemini Nano V3模型以及Tensor G5芯片的本地處理能力。
4、受到續(xù)航、散熱等硬件限制,主動式AI仍難以保持全天在線。如Looki L1,該產(chǎn)品其實不會全天候記錄用戶的生活畫面,相反,它采用了記錄切片的運行方式,如三分鐘記錄15秒的短視頻。另外,無論是MentraOS亦或是Halliday,眼鏡的主動式AI均不是系統(tǒng)級功能,它需要主動打開才能使用,并且它們只支持麥克風(fēng)監(jiān)聽這一基礎(chǔ)能力,尚不支持多模態(tài)。
總的來看,目前主動式AI在各行業(yè)中的應(yīng)用仍處于初步萌芽的階段,但是未來可期,如果說鋼鐵俠的賈維斯在未來某一刻出現(xiàn),那它很可能會作為殺手級應(yīng)用率先在眼鏡端落地。
此前市場上很多人都在探討未來手機與AR眼鏡的關(guān)系,筆者認(rèn)為,兩者會長期共存,但兩者之間可能會因為“主動式AI”功能劃分出一條涇渭分明的界限:手機計算平臺的地位不變,但后續(xù)它更多聚焦于多樣化的應(yīng)用生態(tài)數(shù)據(jù)整合,如常規(guī)網(wǎng)絡(luò)購物、社交、游戲娛樂等;而AR眼鏡則聚焦于即刻以及現(xiàn)實的響應(yīng),并通過AI給予用戶更加個性化的生活服務(wù)。
因而,主動式AI,或許會是科技發(fā)展之路上的一大岔路口,它將讓AR眼鏡賽道變得熠熠生輝并且充滿獨特價值。讓我們期待在隨后數(shù)年中該功能的持續(xù)躍遷。?
文/VR陀螺 萬里
本文由人人都是產(chǎn)品經(jīng)理作者【VR陀螺】,微信公眾號:【VR陀螺】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!