AI Agent崛起:手機操作系統(tǒng)的智能未來
隨著AI技術的飛速發(fā)展,AI Agent(智能代理)正在成為手機操作系統(tǒng)的全新核心,推動手機從傳統(tǒng)的功能集合向智能化服務生態(tài)轉(zhuǎn)變。本文深入探討了AI Agent如何通過自動化功能、多模態(tài)交互和服務生態(tài)融合,徹底改變手機操作系統(tǒng)的交互方式和用戶體驗。
一、AI 手機發(fā)展背景
非 AI 與智能機時代痛點:非 AI 時代,用戶被淹沒到系統(tǒng)生態(tài)之中,用戶需要承擔大量的記憶負擔。從功能機簡單(對比如今其實是簡陋)到復雜的智能機時代,龐雜的功能及服務如海嘯般涌向消費者,手機廠商絞盡腦汁為消費者開發(fā)出很多實用但不常用甚至不曾開啟的功能,一個重要的原因就是缺乏服務設計與用戶場景自動連接的橋梁。在智能機時代,大部分的功能還是依賴簡單的機器學習算法規(guī)則來實現(xiàn)信息檢索和判斷,處于一個低維度的功能實現(xiàn)。
二、AI 手機核心概念
AI 對手機交互的變革:隨著 AI 這幾年的爆發(fā)發(fā)展,這一痛點需求會得到史無前例的滿足。AI 將成為手機與用戶之間交互的交通樞紐。AI 手機發(fā)展路徑,從本地化 AI 功能面向服務生態(tài)化邁進,利用 Agent 能力像八爪魚一樣伸向四面八方。
AI 手機核心:Agent 與服務生態(tài)融合,手機操作系統(tǒng)從去中心化回到了以 AI 為核心的中心化系統(tǒng),例如以蘋果的語音助手 Siri、三星的語音助手 Bixby 為中心,用戶通過多模態(tài)輸入,進行基本的本地功能調(diào)用,生成式回答。
AI Agent 核心能力 – 自動化功能:AI Agent 的核心能力就是自動化功能,可以縮短用戶的交互路徑。在傳統(tǒng)操作系統(tǒng)下,新建一個約會吃飯的日程,需要打開日歷 APP,填寫信息,分享日程,打開微信,選擇聯(lián)系人,發(fā)送。在實際的操作中,很有可能會被其他的操作障礙給中斷,交互效率比較低下。在 AI 賦能的情況下,只需要語音輸入信息,AI 根據(jù)歷史信息進行信息補全,所有動作都會在后臺靜默完成,在重要的核心交互接觸點進行用戶告知。這樣的 Use case 會遍布整個用戶使用系統(tǒng)之中。在有關人們的衣食住行和個人事務安排方面,已經(jīng)有人在踐行,比如 Brain AI 和羅友浩老師的 J1Assistant。
AI 對手機操作系統(tǒng)技術生態(tài)的改變:AI agent 的引入,將會徹底改變手機操作系統(tǒng)的運作技術生態(tài)。在信息整合,搜索,篩選等方面,將會更加智能精準,比如通知,郵件,短信等垃圾信息等過濾將會變得異常精準,利于監(jiān)督學習,將信息作分類,優(yōu)先級排序等處理,語義和意圖識別加上用戶的動態(tài)信息(位置,時間,交互反饋)實現(xiàn)更加準確的個性化處理信息。
三、具體 AI 手機產(chǎn)品實例 – J1Assistant
J1Assistant 整體情況:J1Assistant 是以羅永浩為核心,以它為基準點連接多設備,構成一個完整的 AI OS 生態(tài)群。初版的體驗不盡人意,集成了 Google ,ChatGPT,Perplexity 的信息工具,在功能上實現(xiàn)代辦,備忘,日程。
J1Assistant 框架設計與功能覆蓋:J1Assistant 在基礎框架設計上就是直接沖著要打造一個自我閉環(huán)的 AI 助理的 OS 系統(tǒng),具備代辦,備忘,應用內(nèi)短信社交,信息搜索,Chatbot 等功能。基本覆蓋了用戶在搜索數(shù)據(jù)和生成數(shù)據(jù)的大部分場景,因為具有偶像包袱,整個助手繼承了錘子系統(tǒng)的 GUI 和交互邏輯,尤其是備忘子系統(tǒng),錘子便簽至今用戶活躍度不錯。
J1Assistant 當前整合度與問題:目前的整合度還處于一個初步驗證階段,用戶輸入特定的指令能夠較為準確的分清任務,比如明確指令生成代辦或者便簽,系統(tǒng)能準確生成對應的結(jié)果。我用的是第一個版本,隨著用戶量的沉淀和反饋,系統(tǒng)會進行一定程度的調(diào)優(yōu),目前交互入口過于龐雜,對用戶的交互鏈路會產(chǎn)生回挫。
J1Assistant 搜索模塊拓展:在搜索模塊,我們可以看到助手伸向了各個領域的信息檢索,Google,X,Reddit 等不同的領域分支,還延伸到電子購物。我認為這都是從信息層作為切入口,將來肯定會深入到具體的 AI agent 任務,不單單只做一個信息檢索工具。
目前羅老師的助手受限于研發(fā)成本和歷史原因,多項功能處于半自動化狀態(tài),隨著大模型能力提升,有望讓模型自行識別用戶意圖并進行推理,自動化給出用戶想要的結(jié)果。
四、手機廠商與大模型的合作
手機廠商與大模型合作趨勢:最近蘋果與阿里達成非排他性協(xié)議合作,三星與智普達成深度合作協(xié)議給大模型廠商帶來極大的虹吸效應。過去一年,阿里、百度、訊飛、騰訊、智普與國內(nèi)手機大廠都沒有達成非常深度的合作。相反,世界最大的兩家手機品牌選擇了國內(nèi)模型大廠的深度合作,因海外品牌自研適應國內(nèi)本土的大模型難度大,相信蘋果與三星在國內(nèi)大模型成功落地得到市場正向反饋后,國內(nèi)手機品牌會持續(xù)跟進,甚至走出海外。
蘋果與阿里合作詳情:根據(jù)最新消息,蘋果與阿里巴巴的合作聚焦電商與生活服務:購物體驗優(yōu)化:結(jié)合阿里電商生態(tài),為用戶提供更智能的購物推薦和搜索功能。生活服務接入:可能會通過 AI 助手接入更多本地生活服務,如外賣、打車、支付等。這個合作將助力蘋果完善國內(nèi)手機系統(tǒng)工具和服務體系的整合。強強聯(lián)合將拉開與其他廠商的距離,為其他廠牌提供樣板。AI 驅(qū)動是連接樞紐,沒有 AI 驅(qū)動,很多服務無法打通。
三星與智譜合作及相關產(chǎn)品功能:同樣,三星 Galaxy S25 借助智譜 Agentic GLM 的能力,「語聊視界」支持以 FunctionCall 方式,通過語音對系統(tǒng)級功能進行調(diào)用,可進行日程、出行路線規(guī)劃等一系列個人助理的個性化使用場景拓展。
五、Deepseek 模型分析及應用
Deepseek 的影響力與跟進情況:Deepseek 現(xiàn)象級走紅,從海外紅到國內(nèi),給手機廠商集成 Deepseek 模型做了極大的背書,華為、榮耀、OPPO、魅族、VIVO 都快速跟進。未來帶著 Deepseek 走向海外頗具可能性,老羅的 AI assistant 研發(fā)團隊也可能在積極跟進集成 Deepseek。
DeepSeek V3 性能分析:DeepSeek V3 在較難的學術和閱讀理解類測試(如 MMLU, DROP, MMLU-Redux)表現(xiàn)突出,甚至超越 GPT-4o 和 Claude-3.5。在代碼相關任務(如 Codeforces, LiveCodeBench)和部分如 SimpleQA 的表現(xiàn)相對較弱。整體而言,它在語言理解、推理、數(shù)學等高難度任務上處于領先水平,但在部分開放域問答任務中仍有改進空間。比如對比 Deepseek v3 與 GPT-4o:
SimpleQA (Correct):GPT-4o 領先 13.3,表明在基礎開放問答場景(例如用戶提問 – 直接回答),GPT-4o 更精準。FRAMES (Acc.):GPT-4o 領先 7.2,表示在多輪對話場景中,GPT-4o 更穩(wěn)定。
對于手機 AI OS 系統(tǒng)來講,開放領域問答使用場景較多,例如信息查詢(搜索引擎、新聞、百科)、社交交流(短信、社交媒體、即時通訊)、娛樂(音樂、視頻、游戲)、生活服務(導航、外賣、購物、支付)、AI 助手(Siri、Google Assistant、小愛同學等)。但在目前的開源模型領域中,DeepSeek 在真實的手機 AI OS 用戶使用場景下能夠滿足需求,與小愛同學所使用的模型進行橫向?qū)Ρ葧r,DeepSeek 具有碾壓式的優(yōu)勢。
DeepSeek 模型尺寸與應用情況:只講模型尺寸不講實際場景應用是不行的,DeepSeek-R1 系列模型的參數(shù)規(guī)模從 1.5 億(1.5B)到 6710 億(671B)不等,其中最大模型為 6710 億參數(shù)。相比之下,小米自研的大模型 MiLM 主要有 13 億(1.3B)和 64 億(6B)參數(shù)兩個版本,小米在場景優(yōu)化、本地部署方面做了很多優(yōu)化工作。短期內(nèi) DeepSeek 作為本地模型部署到手機端有距離,目前有些大廠牌將 Deepseek 作為智能體入口放置到手機助手,也有類似 Oppo 某些旗艦產(chǎn)品將滿血版 deepseek 深入集成到助手,可直接語音喚起使用。
手機廠商應用 DeepSeek 的策略困境:一個手機廠牌的產(chǎn)品線覆蓋從低端到旗艦高端多種機型,希望 AIOS 系統(tǒng)覆蓋所有機型,但存在矛盾短期內(nèi)無法調(diào)和。雖有 DeepSeek 這樣開源性能強勁的模型問世,低端機型想要 AI 賦能,只能在低硬件配置基礎上采用現(xiàn)成的云 API + 規(guī)則匹配方式完成,隨時間推移,成本累加,收益遞減。所以目前廠商大多采用旗艦機 + 數(shù)據(jù)集 + 模型優(yōu)化的策略打造 AIOS。雖前期投入大,但后期成本降低,旗艦機高溢價可覆蓋部分本地模型訓練成本投入。
總結(jié),隨著模型能力的不斷提升以及應用場景的持續(xù)拓展,AI 操作系統(tǒng)(AIOS)的發(fā)展演變進程將進一步加快。AI 帶來的價值遠不止是賦予用戶自動化操作的能力,更為關鍵的是,它極大地增強了用戶解決問題的實際能力,使用戶能夠在省時省力的前提下,以高效的方式完成那些以往需要耗費大量精力才能達成的任務,顯著提升了用戶體驗與生活、工作效率。模型價格和體積的縮小,相信會普惠到更多的用戶群里。
本文由 @Antonio 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發(fā)揮!