AI機器人交互設(shè)計模型 (二):五大具體措施

本篇文章是系列文章“機器人高效能交互模型(被CMU和NASA多次引用)”的第二篇。點擊此處查看系列文章目錄。
人和機器人交互的首要目的是提升人與機器人團隊協(xié)作完成任務(wù)的效率,基于這個目標,本文介紹了以下五大措施:
- 區(qū)分自動模式與手動模式
- 讓用戶直接與現(xiàn)實環(huán)境交互
- 讓用戶直接與傳感器信息交互
- 幫助用戶減少記憶成本
- 幫助用戶減少注意力成本
一、區(qū)分自動模式與手動模式
用戶操作機器人的主要模式有:
- 自動模式 (script control):為了讓機器人能夠自動運轉(zhuǎn),用戶需要對機器人的任務(wù)和工作范圍進行預設(shè)和規(guī)劃。此時,用戶需要物理場地里的全局信息(Global)來進行整體任務(wù)的規(guī)劃,如園區(qū)地圖,目的地分布等。通常在觸摸屏上進行交互來進行對機器人進行任務(wù)規(guī)劃。
- 手動模式 (pure teleoperation):手動模式通常只是簡單的遠程遙控,用戶需要知道機器人周邊的實時信息來進行精準操作,如周邊障礙物的距離。
值得注意的是:
在機器人的工作過程中,操作者和機器人會經(jīng)常有任務(wù)切換。因為對于大部分產(chǎn)品來說,AI技術(shù)還沒有成熟到“足夠替代人類”,所以用戶需要經(jīng)常干涉機器的工作任務(wù),這時用戶會切換為手動模式。當用戶需要將機器人從自動模式切換成手動模式/遠程控制模式時,這個交互應(yīng)該是零操作成本的,不猶豫的。系統(tǒng)應(yīng)該根據(jù)用戶的行為,通過恰當?shù)乩斫庥脩粢鈭D,幫助用戶不猶豫地進行模式切換。以幾個例子為例:
在無人車的自動探索任務(wù)中,當機器人發(fā)現(xiàn)可疑人員,用戶(安防人員)需要切換至人工操作來遠程駕駛機器人。用戶只需要撥動遙控感/鍵盤,則系統(tǒng)自動降操作模式切換為手動模式。
在自動駕駛汽車中,當汽車進入駕駛員認為的不安全區(qū)域時,駕駛員需要奪回控制權(quán)。只需要將手握緊方向盤,則允許用戶進行手動駕駛。
自動跟隨行李箱,當旅行者覺得前方有臺階,箱子無法自行通過,旅行者想要將自動跟隨行李箱切換為普通行李箱。只需要伸手拉住拉桿,則電機自動取消動力。
當模式進行了切換時,系統(tǒng)需要提供一個明確的無歧義的交互反饋,告訴用戶關(guān)于模式的切換。這個模式切換的反饋是很重要的,如果機器人已經(jīng)變?yōu)槭謩幽J?,而用戶確認為機器人仍有自動能力,則很容易發(fā)生事故。
二、直接與現(xiàn)實環(huán)境自然交互
人與AI機器人的交互應(yīng)該像人與人一樣自然。通常,人與機器人交互中,自然語言有手勢和語音:
- 語音交互:通過語音對話形式操控機器人。關(guān)于語音交互和CUI,筆者后續(xù)會有相關(guān)文章進行介紹。
- 手勢交互 : 用戶和機器人處于近距離時,通過定義好的手勢對機器人進行指令控制,如暫停前進,旋轉(zhuǎn)等。手勢設(shè)計的難點在于要同時降低三個指標:操作成本、記憶成本、錯誤識別率、計算難度。通常這三個參數(shù)是互相矛盾的:一個特殊的手勢通暢好擺出來,但是用戶卻很難記住反常識的特殊手勢。一個自然的動態(tài)手勢很容易用戶記憶,但是操作起來會顯得傻傻的,在公共場合不舒服。如果想讓用戶在公共場合不尷尬的進行手勢操作,就要把手勢設(shè)計的不是很浮夸,也就是很不“顯眼”。但是這就又給計算力帶來了負擔,增加了模型的訓練難度和計算難度。
三、直接與傳感器信息交互
在機器人交互模型中一個目的是盡可能讓用戶只去關(guān)注物理環(huán)境而非機器人本身,換句話說就是盡量地讓機器人在整個交互過程中“透明化“。
自動行走的機器人通常安裝有眾多傳感器,如:攝像頭,激光雷達,測距雷達、GPS等。當用戶進行遠程控制機器人時,這些傳感器的數(shù)據(jù)是用戶獲得的關(guān)于機器人所處環(huán)境的基礎(chǔ)信息,與此同時,好的機器人系統(tǒng)應(yīng)該允許用戶直接與這些數(shù)據(jù)進行交互。因為在操作機器人的過程中,用戶很難只是通過簡單的搖桿或鍵盤控制機器人的前進方向和角度。因此這種交互形式下,用戶很難將他的操作指令與機器人在實際物理環(huán)境中的結(jié)果關(guān)聯(lián)起來。(HRI領(lǐng)域一個很出名的說法是“人類操作者不知道機器人的肩膀在哪里”,講的就是用戶很難真正理解機器人在真實物理環(huán)境中行動所帶來的結(jié)果)所以如果應(yīng)該盡量讓用戶忽視機器人的存在,而直接與機器人所在的物理世界產(chǎn)生交互,則會有效解決此問題:
- 局部視野指點 (Camera):操控機器人時,在交互界面中直接點擊機器人視野圖像中的某個物體,或某個位置。機器人系統(tǒng)計算出用戶所指的點在物理世界中的位置,進而自動走到目的地。
- 局部視野審查(Camera): 當用戶想要通過機器人更清楚地查看某個東西時,無需操控機器人朝該物體前進,而只需要在屏幕上的機器人視野中進行放大,則機器人會自動向目的物體運動。相似,當用戶想讓視野中看到更多物體的時候,只需要進行縮小操作,則機器人會自動后退,讓用戶獲得一個更全面的視野。
- 全局地圖指點 (GPS) : 用戶為了讓機器人前進至全局地圖中的某個位置,在地圖上進行直接選擇。系統(tǒng)計算出用戶所指的點在物理世界中的位置,然后自動走到目的地。
- 直接操作距離 (Sonar) : 用戶通過直接增大超聲波/紅外傳感器數(shù)值,而讓機器人遠離障礙物。用戶通過減小超聲波傳感器的數(shù)值,而讓機器人靠近該物體。
總結(jié)來說就是用戶不應(yīng)該作為傳感器數(shù)據(jù)的融合者,用戶也沒有能力將各種傳感器的數(shù)據(jù)綜合起來去感知機器人周邊的環(huán)境。用戶唯一需要做的就是表達他想在物理世界中的意圖,然后機器人系統(tǒng)自動拆分任務(wù)參數(shù)(距離和角度等)
四、幫助用戶減少記憶成本
當用戶同時操作多個機器人時,很難順利的在不同機器人之間進行切換。面對這種情況,系統(tǒng)需要記錄每個機器人在過去的經(jīng)歷,包括過去發(fā)生的錄像,所走的路徑,遇到的障礙物信息等。目的是讓用戶無須時刻記憶機器人的運行狀態(tài),而只關(guān)注機器人目前的現(xiàn)狀。若用戶想要回放之前機器人執(zhí)行任務(wù)時遇到的狀況,則只需要回播?;夭サ男畔⒉粌H是攝像頭視頻,也應(yīng)該包括同步的各種傳感器數(shù)據(jù)。讓操作者在回到過去后,仍然能夠理解機器人所處的物理環(huán)境。
五、幫助用戶減少注意力成本
在用戶操作機器人的過程中,交互效率的瓶頸是用戶的注意力不夠。用戶可能同時在操作多個機器人,也可能在與機器人工作的同時并行完成其它工作任務(wù)。減少機器人對操作者的關(guān)注需求成為了解決“人-機團隊”完成任務(wù)效率的重要方向(參考《AI機器人交互設(shè)計模型 (一)評估機器人交互的七大指標》中的“杠桿倍數(shù)”)。通過降低單個機器人對用戶的注意力的需求,從而提升“杠桿倍數(shù)”,即一個用戶可以同時操作的機器人個數(shù)。 一些例子:
- 如果用戶沒有注意到距離傳感器上的數(shù)值在一直變小,機器人很快要撞上某個障礙物,則系統(tǒng)應(yīng)該及時提醒用戶,或標亮即將出現(xiàn)事故的傳感器數(shù)據(jù)。
- 當用戶同時操作多個多個機器人時,當一個機器人需要用戶的注意力,則該機器人應(yīng)該被標注出來,為用戶提供線索。相反,如果沒有主動提醒,用戶就必須要時不時的去輪檢機器人的運行狀態(tài)。
- 當機器人系統(tǒng)中有多個任務(wù)需要用戶去人工操作時,系統(tǒng)應(yīng)該幫助用戶管理注意力。比如幫助用戶判斷哪個任務(wù)是最緊急重要的,從而幫助用戶更高效的管理機器人去完成工作任務(wù)。
本篇文章是系列文章“機器人高效能交互模型(被CMU和NASA多次引用)”的第二篇。本系列文章介紹Olsen與Goodrich的經(jīng)典論文“Metrics for Evaluating Human-Robot Interactions” 以及Scholtz 的“Theory an Evaluation of Human Robot Interaction”。筆者畢業(yè)于歐盟創(chuàng)新技術(shù)研究院研究HCI專業(yè),最近在創(chuàng)業(yè)做低速無人車自動駕駛。近期在讀CMU和NASA的文章時,發(fā)現(xiàn)這兩篇論文被多次引用提及。仔細研究后發(fā)現(xiàn)字字干貨,于是吸收整理后輸出給大家。
相關(guān)閱讀:
AI機器人交互設(shè)計模型 (一)評估機器人交互的七大指標
作者:石大大,知乎:石大大,微信公眾號:Thirsty
本文由 @石大大 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖由作者提供
- 目前還沒評論,等你發(fā)揮!