蘋果被大模型打得措手不及

0 評論 747 瀏覽 0 收藏 18 分鐘

生成式AI發(fā)布已經(jīng)快2年了,國內外不少公司都有自己的大模型,但作為科技龍頭之一的蘋果卻一直沒有消息;顯然,蘋果是落后于AI發(fā)展的時間線了。

2023來,英偉達憑借其AI硬件業(yè)務的強勁表現(xiàn),實現(xiàn)市值6.3倍增長,達到2.36萬億美元。ChatGPT、Sora等生成式AI的發(fā)布,更使科技行業(yè)邁入全新的發(fā)展階段。

在可預見的未來,AI的重要性日益顯現(xiàn)。未能有效把握AI發(fā)展機遇的科技企業(yè)將面臨被市場淘汰風險。在美股“七巨頭”中,唯獨蘋果在AI布局上表現(xiàn)極為謹慎,備受外界關注。

3月20日,庫克在微博稱自己到訪上海,此行的目的之一是參加Apple靜安店的揭幕儀式。據(jù)悉,這家直營店的規(guī)模全球第二。盡管庫克外灘散步,并品嘗了上海的早餐,但此刻他并不輕松,因為眼下的蘋果飽受爭議。

3月21日,美國司法部和十幾個州的總檢察長對蘋果公司提起了反壟斷訴訟。隨即,蘋果股價低開低走,收跌4.09%,報收于171.37美元,創(chuàng)下自2023年8月4日以來的最大單日跌幅。其市值一夜之間蒸發(fā)超過1100億美元。

業(yè)務方面,據(jù)市場調研機構Counterpoint Research最新數(shù)據(jù)顯示,今年前六周,iPhone在中國銷量同比下降24%,整體排名第四。根據(jù)蘋果公司2024第一季財報數(shù)據(jù),大中華地區(qū)該季度營收為 208 億美元,同比減少13%。

產(chǎn)品布局方面,蘋果發(fā)售了XR穿戴設備“Vision Pro”,雖然發(fā)售當日加價6萬,但如今已因體驗不成熟而跌破發(fā)行價,引發(fā)退貨潮。

籌備10年,投資超過100億美元的蘋果“泰坦”造車項目也被取消,大部分汽車團隊成員將被轉至人工智能部門,取消造車的原因我們在文章《蘋果這次遙遙落后了》做出了分析,這里不多贅述。

外界普遍認為,蘋果若想繼續(xù)保持領先地位,關鍵在于其AI領域的布局成果。天風國際分析師郭明錤曾評價指出:如果蘋果今年無法推出優(yōu)于市場預期的生成式AI服務,那么英偉達的市值很可能將超越蘋果。

我們認為,蘋果在人工智能技術并不是毫無準備,但以OpenAI為主的生成式AI發(fā)展如此迅速,讓蘋果公司始料未及。顯然,蘋果是落后于AI發(fā)展的時間線了,為了安撫投資者與用戶,庫克于上海期間也再次強調:“蘋果的生成式AI,在今年晚些時候會有新聞宣布”。

一、蘋果的AI路

1985年,喬布斯在瑞典隆德大學發(fā)言:“我希望有一天,當下一個亞里士多德出現(xiàn)時,我們可以用一臺電腦捕捉亞里士多德的基本智能。這樣,后代的學生就可以向亞里士多德提問,并且可以得到回答”。

喬布斯幾乎預見了大模型技術的崛起,并堅信人工智能將為蘋果公司帶來遠大前景。Siri是由喬布斯主導,蘋果公司對人工智能最早的探索,但在庫克時代,蘋果在人工智能領域的發(fā)展步伐卻有所減緩。

蘋果AI的發(fā)展可以分為三個階段:

1. Siri階段

2010年,蘋果就以2億美金收購了“Siri”項目,并將其發(fā)展為串聯(lián)蘋果生態(tài)的智能語音助手。Siri發(fā)布的同時,正逢科幻電影《鋼鐵俠》大熱,其中的人工智能“賈維斯”仿佛就是Siri的完全體,讓用戶無限期待。

然而,盡管Siri已經(jīng)歷了長達14年的迭代更新,但用戶對其的評價卻相當糟糕。Siri幾乎未展現(xiàn)出明顯的進步或提升,其功能仍然主要局限于查詢天氣、設置鬧鐘、講述笑話等簡單任務。在面對更復雜的對話場景時,Siri往往無法妥善處理,轉而直接跳轉至搜索網(wǎng)頁。此外,Siri在語言的識別以及句式的理解方面也存在較大缺陷,因此常被戲稱為“人工智障”。

Siri表現(xiàn)不佳的原因其實并不難以理解,要想實現(xiàn)Siri內容更豐富、功能更全面、個性化更出色,必須不斷深入收集與分析用戶的錄音與行為數(shù)據(jù)。對于蘋果而言,其一直將用戶隱私保護作為產(chǎn)品力的核心,因此,這樣的升級將與其產(chǎn)品理念產(chǎn)生較大的沖突。

2019年英國《衛(wèi)報》報道稱,一名舉報者向他們透露,蘋果用Siri記錄用戶說話,引起軒然大波。這是因為蘋果使用外包團隊收集相關數(shù)據(jù)以對Siri進行優(yōu)化。蘋果最終用全職員工取代了外包商,并且修改了相關規(guī)定,普通員工很難聽到Siri的對話錄音。

所以,Siri回答用戶時只能在預設的數(shù)據(jù)庫中尋找答案,《紐約時報》曾報道稱,Siri簡單添加單詞需要長達六周的時間,這讓Siri難以實時優(yōu)化與迭代,逐漸遠離人工智能概念。

2. “仿生”階段

蘋果仿生芯片自2017年起沿用至今,它最早誕生于iPhone X/8/8Plus的A11 Bionic處理器。它是手機處理芯片中增加了一個AI運算加速內核,又稱NPU(嵌入式神經(jīng)網(wǎng)絡處理器)。

這塊獨立內核主要負責語音、圖像、視頻的識別工作,iPhone中的多項功能均依賴其運作。舉例來說,它能夠依據(jù)照片標簽自動生成回憶視頻;快速提取照片中的圖像與文字信息;根據(jù)用戶的使用習慣優(yōu)化任務處理速度;實現(xiàn)面部解鎖準確性提升等。這些功能的強大之處在于,它們均基于本地計算得以實現(xiàn),無需依賴外部服務器,從而確保了用戶數(shù)據(jù)的安全與隱私。

也因為名為仿生(bionic),彼時外界普遍認為這是一顆人工智能芯片。

實際上,仿生芯片特殊之處在于計算時不會干擾到CPU和GPU的正常工作,能在極低的功耗下瞬時為用戶完成計算。但從另一個角度來說,這只實現(xiàn)了“人工”,并沒有實現(xiàn)“智能”,真正的智能應該是具有自我學習能力,而不是預設的計算方式。值得一提的是,高通在2017年也推出了具有神經(jīng)網(wǎng)絡系統(tǒng)的SOC——驍龍845。

3. “空間計算”階段

庫克在 2023 年的WWDC主題演講中表示:“空間計算將數(shù)字內容與物理世界無縫融合,同時允許用戶保持存在并與他人保持聯(lián)系”。顯然,此時蘋果是相信未來是屬于MR設備所打造的元宇宙的。

蘋果在2017年的IOS 11上首次展示了AR概念,并發(fā)布了AR開發(fā)工具ARkit。配合首發(fā)于iPad Pro的LiDAR激光雷達,用戶能將原本不切實際或天馬行空的想法呈現(xiàn)在眼前。隨后,蘋果陸續(xù)推出空間音頻、增強現(xiàn)實等功能,最終這些線索被今年發(fā)售的Vision Pro所串聯(lián)。

蘋果對傳感器技術的運用頗為倚重。初代iPhone雖未配備鍵盤、3G功能以及自拍攝像頭,卻搭載了距離傳感器、光線傳感器乃至加速度傳感器等先進組件。這些傳感器的運用使得iPhone在智能化水平上遠超當時市場上的其他手機產(chǎn)品。

蘋果致力于通過傳感器與算法技術,淘汰傳統(tǒng)的交互邏輯。iPhone的推出,成功使手機擺脫了手寫筆和鍵盤;空間計算領域,蘋果期望能夠突破屏幕與手持設備的局限性。而在汽車領域,蘋果更是寄望于大量傳感器與先進計算技術的結合,使用戶在未來能夠擺脫方向盤的束縛,實現(xiàn)真正意義上的自動駕駛。

因此,蘋果汽車項目同樣是傳感器與算法技術應用的典型案例。盡管蘋果在造車項目上歷經(jīng)波折并最終放棄,但在相當長的一段時間內,蘋果積極收集了大量相關專利。除了眾所周知的自動駕駛技術外,蘋果還探索了更為前沿的技術領域,如增強現(xiàn)實顯示導航;利用雷達生成周圍高分辨率信息;估算道路表面摩擦系數(shù)的方法;根據(jù)交警手勢判斷交通狀況以及車輛自主接入電源等。

讓設備通過傳感器了解用戶,通過深度學習算法為用戶提供所需要的支持,這是蘋果對“人工智能”的理解。MR、空間計算是蘋果認為的科技發(fā)展大方向,也是蘋果對技術整合的最終階段,在“機器之心”對蘋果收購案例的整理中,也能印證這點。

二、措手不及的蘋果

蘋果公司歷來高度重視自身的品牌形象。自庫克執(zhí)掌蘋果以來,始終堅持只將成熟的技術呈現(xiàn)給用戶,即便某項技術備受市場矚目,也不會輕易上馬。穩(wěn)健的市場策略確保了蘋果在產(chǎn)品與生態(tài)構建方面保持著極高的專注度。

蘋果是相信人工智能的,只不過它是以收集數(shù)據(jù)和設備協(xié)同的方式來實現(xiàn)這一點。而生成式AI的出現(xiàn)似乎不在蘋果的理解范圍之內,目前來看,當AI能夠理解語言后,其學習能力已經(jīng)不能以對待機器人的眼光去看了。

從蘋果近期的行動來看,似乎也沒有坐以待斃,據(jù)市場調研機構Stocklytics最新報告披露,截止2023年,蘋果總共收購了32家AI公司,是科技公司中收購數(shù)量最多的?,F(xiàn)在的蘋果似乎既怕趕不上AI大模型的熱潮,又怕在發(fā)展過程中壓錯注。

媒體報道下的蘋果AI同樣撲朔迷離,今年初,蘋果被曝光已經(jīng)開始研發(fā)AI大模型,代號為Ajax,蘋果內部稱之為Apple GPT,擁有2000億參數(shù)的Apple GPT可能與OpenAI最新的大模型性能相當。

但近日,在網(wǎng)站arXiv中,蘋果上新了一篇名為《 MM1 : Methods , Analysis & Insights from Multimodal LLM Pre-training 》的論文,其中他們公布了名為MM1 的基礎大模型,其中最大規(guī)模的只有300億參數(shù)。相比之下,谷歌PaLM大模型擁有5400億參數(shù),OpenAI的GPT-4更是被猜測擁有1.7萬億參數(shù)。

甚至據(jù)知名蘋果爆料人Mark Gurman稱,蘋果正在和谷歌洽談“將谷歌Gemini Nano植入iPhone事宜”,谷歌Gemini Nano也是三星手機使用的端側大模型。

目前外界對蘋果大模型的說法層出不窮,在官方?jīng)]有公布之前,很難斷定蘋果最后會以什么方式入局。我們認為,蘋果在大模型布局上的進度相對緩慢主要是以下兩點原因:

1. 大模型to C應用場景的空白

包括Chat-GPT在內,大部分生成式AI大模型仍圍繞著網(wǎng)頁對話框,對于普通用戶來說,本質上還是一個更“智能”的私人助理或聊天機器人,如果大模型的作用只是給Siri升個級,蘋果無需大費周章。

與其他巨頭不同,蘋果是更面向用戶的科技公司。儲備相關技術,并尋找將其轉化為優(yōu)質用戶體驗的切入點,這才是蘋果一貫的產(chǎn)品思路。

2. 難以權衡用戶隱私性

Siri項目不止一次引發(fā)過用戶對隱私問題的擔憂,而大模型的訓練更會如此,蘋果作為一家特別強調用戶隱私安全性的科技公司,自然要將生成式AI大模型的應用建立在保護用戶隱私的前提下。

蘋果與OpenAI等公司的差異在于,蘋果的AI大模型旨在服務全球22億臺蘋果設備的用戶,自然要針對性地收集用戶信息并進行個性化訓練。蘋果要考慮拿出一個什么樣的隱私解決方案,目前最好的方法就是放入一個端側的本地大模型,但這是否能帶來突破性的體驗還尚未可知。

三、對大模型應用場景的一些預測

首先,我們認為生成式AI大模型的核心優(yōu)勢在于打造各行業(yè)的“超級工具”, 類似于Sora在影視行業(yè)中所展現(xiàn)出的深遠影響力。經(jīng)過對每個行業(yè)內容的深度訓練,大模型能夠顯著提供精準、高效的解決方案,從而成為推動行業(yè)發(fā)展的強大引擎。

其次,大模型對于To C場景而言,可想像的空間十分豐富,無論是為用戶提供多元化的教育資源,還是進行精準的金融分析,或是實現(xiàn)個人情緒疏導,大模型都能依托其龐大的數(shù)據(jù)庫進行個性化訓練,但實現(xiàn)這些功能最大障礙依然是隱私安全問題。

蘋果并非完全不在用戶手機中收集數(shù)據(jù),實際上,蘋果用戶可以通過訪問“iPhone-隱私與安全性-分析數(shù)據(jù)”來查看被收集的大量數(shù)據(jù)。然而,蘋果采用了差分隱私算法,確保即便在收集數(shù)據(jù)的過程中,蘋果也無法確定這些數(shù)據(jù)具體來自哪部手機。目前,該算法主要收集硬件和性能統(tǒng)計等信息。

因此,我們期待蘋果能夠妥善解決大模型訓練與隱私保護之間的矛盾,進而為用戶構建一個功能全面的AI助理,或AI分身,協(xié)助用戶高效處理工作、生活事務。同時,也存在蘋果憑借其M系列處理器開創(chuàng)全新AI領域的可能性,從而成為一家融合用戶、軟件、硬件于一體的綜合性AI公司。

目前市場中盡管已有眾多手機應用了AI大模型技術,但尚未有能夠撼動iPhone市場領導地位的產(chǎn)品出現(xiàn)。iPhone在華銷售額的下跌,并非完全歸咎于AI技術方面的欠缺。因此,從蘋果積極收購大量AI公司,并將其巨額投入的造車團隊轉移至AI項目等舉措來看,蘋果顯然已經(jīng)明確了自己的AI發(fā)展策略與方向。

接下來,人工智能領域能否迎來 “iPhone時刻”,或者這僅僅是蘋果公司在面臨困境時的倉促之舉,預計在今年6月的WWDC中,我們就能夠窺見一二。

作者:張從白,編輯:周在安

來源公眾號:蔚然先聲,換個視角理解中國商業(yè)

本文由 @蔚然先聲 授權發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!