AI 時代地圖語音助手的體驗進化
語音是人們日常生活中最常用的交互方式,隨著AI技術的發(fā)展,也被逐漸應用車載產品中,語音助手有助于駕駛過程中解放用戶的手眼,提升駕駛安全性。本文從語音助手的概念出發(fā),對當前語音助手的體驗設計趨勢進行了梳理與說明,與大家分享。
人們日常出行越來越依賴地圖進行導航指路、查路況以及找附近興趣點。而用戶在開車途中用手操控或視線瀏覽屏幕,具有很大的安全風險。語音助手的出現(xiàn)極大解放了駕駛過程中用戶的手眼,提升駕駛安全性。它不僅支持全程語音喚醒,還能快速精準理解用戶指令,提出有效解決方案。
01 語音助手概念
語音助手是指在硬件設備或 APP 軟件上植入人機對話程序,輔助用戶通過語音方式使用宿主設備或程序上的功能。完整的人機對話包括聲音信號的前端處理、將聲音轉為文字供機器處理、在機器生成語言之后,用語音合成技術將文本語言轉化為聲波,從而形成完整的人機語音交互。
02 語音助手體驗趨勢
AI技術的發(fā)展以及硬件升級,賦予智能設備越來越多感知通道,也不斷增強通過各種媒介進行信息輸出的能力。感知和輸出層之外,情感計算能力的提升使機器在認知層得到質的飛躍。它們遠比之前更懂用戶,也遠比之前更會表達。基于設計理解與實踐,我們認為語音助手體驗在交互通道、交互對象方面正呈現(xiàn)三個趨勢:
- 信息服務的表達融合多通道體驗
- 對話貼近人的自然本能
- 具備情感交互能力
2.1 信息服務的表達融合多通道體驗
除語音通道外,AI計算機視覺技術拓展了人臉、隔空手勢等交互通道,而傳統(tǒng)觸控、旋鈕等交互方式在操作精度、信息輸出效率以及技術成本方面還有自身優(yōu)勢。多通道融合能發(fā)揮不同通道的優(yōu)勢和場景適用性,對信息服務的表達更自然,效率最大化。
2.1.1 地圖語音交互形態(tài)重構
基于觸屏手機設備的地圖語音,視覺信息的協(xié)同輸出能有效彌補語音無形、線性、不易記憶等缺陷,增進用戶對語音交互體驗的理解。在近場交互時,觸屏還支持信息快速回復。
形態(tài)是地圖語音不可或缺的重要通道。
初次引入語音交互能力,為了減少認知成本,地圖語音的交互形態(tài)沿用業(yè)界通用的封閉式對話流。而這種形態(tài)也隨著語音支持的地圖功能擴展而產生局限性:
(1) 形態(tài)獨立封閉且與場景不融合,會對導航產生干擾,影響駕駛安全。
(2) 不能利用地圖原有的信息表達,需要在對話流中單獨呈現(xiàn)結果。不僅影響算路等復雜需求的拓展,還會增加設計與開發(fā)的維護成本。
為真正適合地圖場景,語音助手形態(tài)完成向非模態(tài)、任務伴隨式面板的重構:利用地圖原有的信息功能做展示,同時支持語音和觸控兩種回復方式,提升多輪對話效率。區(qū)別于封閉式對話流,伴隨式面板不跳脫當前場景,帶給人更輕量的感受。
語音形態(tài)的簡化在一定程度削弱了語音狀態(tài)的表達,為了確保用戶對語音狀態(tài)的強感知,面板信息框架的頭部在語音進程中持續(xù)展示小度頭像動效和文案提示。
2.1.2 地圖語音結果VUI與GUI協(xié)同
在檢索地點等任務場景中,用戶通常注重效率。VUI結果話術的設計首先以目標為中心為原則,在精確檢索單個結果時,引導用戶進行下一步行動;而在模糊檢索有多個結果時,向用戶詢問選擇或推薦可能最感興趣的地點并引導行動。
配合VUI話術,GUI也做相應的協(xié)同展現(xiàn):數(shù)字序號匹配VUI的問詢和用戶選擇,而推薦結果的高亮和標簽使VUI推薦地點映射GUI,增強結果的表達效率。
2.2 對話貼近人的自然本能
連續(xù)對話且可隨時打斷,符合日常交流本能意識,但目前絕大多數(shù)產品語音交互仍不夠自然:發(fā)起對話需要在安靜環(huán)境下,先喚醒再發(fā)出指令,并且以“一問一答”為主。隨著全雙工免喚醒等語音技術的出現(xiàn),通過上下文信息對用戶指令的預測和判斷,可以免去中間喚醒環(huán)節(jié),實現(xiàn)更為自然流暢的多輪對話。
在實現(xiàn)自然對話前,有效的認知教育是降低用戶使用語音門檻的必經途徑。
2.2.1 地圖語音認知教育體驗創(chuàng)新
由于語音信息“隱形”特性,存在技能可發(fā)現(xiàn)性弱的缺陷,導致用戶時常忽略使用。同時,經地圖語音基礎調研發(fā)現(xiàn),不習慣操作方式是用戶不使用語音的首要原因。
地圖語音基礎調研_不使用語音原因
語音技能在不斷擴充的同時,需要解決如何增強語音可感知,加強用戶學習并培養(yǎng)使用習慣。入口觸達和場景化引導是增強語音可感知必不可少的手段:在用戶未形成語音喚醒習慣時,入口作為用戶在觸屏感知功能的意符必不可少,而它還是語音喚醒效果不佳時的有效補 充。另外,語音作為自然高效的交互模式,需要基于語音優(yōu)勢場景強化引導,激發(fā)使用動力。
技能中心是進行語音集中用戶教育的特有場所。市面上絕大多數(shù)產品的技能中心,都是以說明書的文本方式進行教育,本質上仍是閱讀為主。而認知研究表明,而我們的大腦為語言而非閱讀而設計。說話和理解口頭語言是自然的人類活動,但閱讀不是。為了追求最真實的學習效果,地圖語音通過線上真實環(huán)境以聽說的方式完成沉浸式新手教育。
在用戶的心智模型里,語音的工具概念決定了用戶在有意圖時才會使用,這對學習以及習慣養(yǎng)成所需的實踐頻次和規(guī)律性都難免造成影響。因此,地圖語音技能中心提出小度成長概念,完成每日任務,用獎勵幫助小度成長,用戶在潛移默化之快速學習技能,培養(yǎng)使用習慣。
任務主要在個性化、熱度、等級等維度進行組織,比如個性化方面,優(yōu)先展示用戶容易出錯的指令任務,通過反復學習解決指令的表達問題。
2.3 具備情感交互能力
語言是人類智能的象征,用戶對語音產品會產生“移情”效應。情感計算可以使產品通過情緒分析等機器學習算法處理相關數(shù)據(jù),如人的面部表情、肢體動作以及各種心理參數(shù):心跳、脈搏、腦電波等,結合外界環(huán)境信息,最終計算出人的情感狀態(tài)。再從硬件層面、GUI及VUI層面給予立體的情感反饋,實現(xiàn)情感交互。
當前地圖語音主要基于導航駕駛環(huán)境的數(shù)據(jù)來主動提供服務與建議。
2.3.1 地圖語音主動服務
地圖語音主動服務當前主要包括安全建議、路況以及目的地服務等三個主要場景。比如在用戶高速長時間駕車時,提供最近休息服務區(qū);路段出行擁擠時,建議合適路線;而在臨近目的地時推薦方便停車點。在駕車過程中的關鍵觸點提供有價值的主動服務,提高駕駛安全性,建立可信任的情感聯(lián)系。
隨著未來透過更多傳感器來獲取人體相關數(shù)據(jù),能準確把握用戶情緒狀態(tài),在導航中提供有利于情緒安撫和安全駕駛的主動服務。
寫在最后
AI時代,語音助手本身將有機會成為唯一的服務主體而存在。
受益于語音能力的進一步進化,信息與服務圍繞用戶而非介質持續(xù)流動。人對自然、情感、個性化的訴求比以往任何一個時代更為凸顯,語音體驗將更加實時多變。進化的另一面,用戶隱私與商業(yè)競爭將會影響這一理想愿景的實現(xiàn)。
參考文章:
[1] 《2020年中國智能語音行業(yè)研究報告》
[2] 《2019AI人機交互趨勢研究》
本文由 @Du Design 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!