麻豆成人久久精品二区三区免费 ,国产精品亚洲一区二区三区,精品国产一区二区三区久久久狼

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專(zhuān)項(xiàng)技能課

1300+專(zhuān)題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專(zhuān)業(yè)技能直播

會(huì)員專(zhuān)屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

人工智能時(shí)代，語(yǔ)音交互將成為最流行最普遍的交互方式

WOWDesign

2017-02-22

6 評(píng)論 20999 瀏覽 29 收藏

10 分鐘

在即將到來(lái)的物聯(lián)網(wǎng)時(shí)代，人工智能會(huì)是流量入口，那么語(yǔ)音交互就成了極具競(jìng)爭(zhēng)力的交互方式。

近幾年，“人工智能”已經(jīng)成為互聯(lián)網(wǎng)圈里面出現(xiàn)頻次最高的一個(gè)詞匯，隨著技術(shù)的的進(jìn)步和社會(huì)的發(fā)展，物聯(lián)網(wǎng)時(shí)代已經(jīng)成為繼移動(dòng)互聯(lián)時(shí)代之后的下一個(gè)浪潮。在PC時(shí)代，瀏覽器是流量入口，人類(lèi)通過(guò)鍵盤(pán)和鼠標(biāo)和信息進(jìn)行交互；在移動(dòng)互聯(lián)網(wǎng)時(shí)代，以App Store為代表的移動(dòng)應(yīng)用商店成為了流量入口，人類(lèi)通過(guò)觸摸屏上的GUI來(lái)操縱App和信息進(jìn)行交互；在即將到來(lái)的物聯(lián)網(wǎng)時(shí)代，人工智能會(huì)是流量入口，那么語(yǔ)音交互就成了極具競(jìng)爭(zhēng)力的交互方式。

目前，在語(yǔ)音交互相關(guān)的領(lǐng)域已經(jīng)出現(xiàn)了一批玩家和產(chǎn)品，國(guó)外的有Google Now、微軟的Cortana（小娜）、Facebook的Message Platform、蘋(píng)果的Siri、亞馬遜的Echo、Google Home的智能音箱，國(guó)內(nèi)的科大訊飛、百度的智能機(jī)器人（度秘）、搜狗語(yǔ)音、微信的語(yǔ)音功能等，雖然這么多大牌玩家進(jìn)入語(yǔ)音交互的領(lǐng)域，但由于技術(shù)和社會(huì)環(huán)境的限制，語(yǔ)音交互還處在起步階段，相關(guān)的語(yǔ)音交互技術(shù)還無(wú)法支持大規(guī)模的應(yīng)用和推廣。

要想讓語(yǔ)音交互流行起來(lái)，必須合理解決以下幾點(diǎn)客觀的限制：

1、語(yǔ)音識(shí)別技術(shù)還處于起步階段。

語(yǔ)音識(shí)別技術(shù)，也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition，(ASR)，其目標(biāo)是將人類(lèi)的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入，例如按鍵、二進(jìn)制編碼或者字符序列。語(yǔ)音識(shí)別的研究工作可以追溯到20世紀(jì)50年代AT&T貝爾實(shí)驗(yàn)室的Audrey系統(tǒng)，它是第一個(gè)可以識(shí)別十個(gè)英文數(shù)字的語(yǔ)音識(shí)別系統(tǒng)。并且一些行業(yè)巨頭也都是在2010年左右才開(kāi)始加大對(duì)語(yǔ)音技術(shù)的投入。各大巨頭各自為戰(zhàn)，語(yǔ)音識(shí)別領(lǐng)域里面還沒(méi)有形成統(tǒng)一的行業(yè)標(biāo)準(zhǔn)和應(yīng)用生態(tài)。

2、使用場(chǎng)景有限。

語(yǔ)音識(shí)別技術(shù)對(duì)環(huán)境要求苛刻；在識(shí)別的準(zhǔn)確率上受較多因素的影響，比如背景噪音、口音、語(yǔ)速、特定領(lǐng)域的專(zhuān)有名詞等都影響準(zhǔn)確率。有一項(xiàng)這樣的測(cè)試，有人隨機(jī)截取了幾段網(wǎng)絡(luò)課程用主流的云端引擎測(cè)試識(shí)別準(zhǔn)確度，基本上準(zhǔn)確率在70%左右；然后又截取了一段新聞聯(lián)播的音頻，用同樣的云端引擎做測(cè)試，準(zhǔn)確率達(dá)到了95%左右。由這個(gè)測(cè)試我們可以清楚的看到客觀因素對(duì)語(yǔ)音識(shí)別準(zhǔn)確率的影響，要知道在這個(gè)行業(yè)5%的準(zhǔn)確率就是可以引起行業(yè)變革的。目前的技術(shù)先限制導(dǎo)致語(yǔ)音交互體驗(yàn)的機(jī)器感特別強(qiáng)，缺乏人性化的感知，沒(méi)有人喜歡跟呆板的機(jī)器一直做交流的。

3、語(yǔ)音交互是非可視化的，非常消耗用戶(hù)的注意力，增加記憶負(fù)擔(dān)。

人在與系統(tǒng)做交互的時(shí)候，能記住的信息也就10秒左右。舉一個(gè)常用的場(chǎng)景，有時(shí)候打銀行的客服電話(huà)，你必須集中精力聽(tīng)語(yǔ)音播報(bào)，一旦被打斷就又得從頭聽(tīng)一遍。

4、用戶(hù)習(xí)慣還未完全養(yǎng)成。

沒(méi)有人愿意對(duì)著冰冷的機(jī)器說(shuō)話(huà)，然后得到毫無(wú)感情的甚至是錯(cuò)誤的回應(yīng)。用戶(hù)對(duì)語(yǔ)音交互對(duì)象的要求不但是可以聽(tīng)懂，還應(yīng)該能人性化的給以回應(yīng)，人類(lèi)更期望通過(guò)語(yǔ)音達(dá)到人人交互的感受，而不是人機(jī)交互，這也是為什么語(yǔ)音交互的普及很大程度上依賴(lài)于人工智能技術(shù)的發(fā)展。

語(yǔ)音交互將成為物聯(lián)網(wǎng)時(shí)代最流行也是最普遍的交互方式

但是，這些客觀條件的限制并不能阻擋語(yǔ)音交互成為物聯(lián)網(wǎng)時(shí)代最流行也是最普遍的交互方式。

1、語(yǔ)言的本質(zhì)是進(jìn)行信息的交流。

從人類(lèi)進(jìn)化的角度來(lái)看，語(yǔ)音是先于文字產(chǎn)生的，我們?cè)賮?lái)看一個(gè)現(xiàn)象，所有的嬰兒都是先學(xué)會(huì)了說(shuō)話(huà)，然后才會(huì)學(xué)習(xí)寫(xiě)字。視覺(jué)和觸覺(jué)的交互都需要硬件在可視范圍之內(nèi)才能完成，而聲音的傳播路徑是球形的360度，可傳播范圍非常廣，而且獲取信息的方式門(mén)檻低。

2、語(yǔ)音交互的兩個(gè)關(guān)鍵點(diǎn)為語(yǔ)音識(shí)別和語(yǔ)義理解。

在語(yǔ)音識(shí)別方面，隨著智能終端的普及應(yīng)用，我們已經(jīng)獲取了大量的語(yǔ)音數(shù)據(jù)資料，再加上算法的優(yōu)化，這為計(jì)算機(jī)的深度學(xué)習(xí)提供了大量的支持。這其實(shí)就跟人類(lèi)學(xué)習(xí)語(yǔ)言是一個(gè)道理。首先，你的大腦要有學(xué)習(xí)認(rèn)知的能力（相當(dāng)于算法）；同時(shí)，你還要掌握充分的詞匯量，接受足夠的聽(tīng)力訓(xùn)練（相當(dāng)于語(yǔ)音數(shù)據(jù)），你才能聽(tīng)懂一門(mén)語(yǔ)言（語(yǔ)音識(shí)別）。學(xué)習(xí)英語(yǔ)的時(shí)候通過(guò)大量的聽(tīng)力練習(xí)強(qiáng)化我們的聽(tīng)力也是同樣的道理；

語(yǔ)義理解依賴(lài)于神經(jīng)網(wǎng)絡(luò)（ANN）的技術(shù)，本質(zhì)上是一個(gè)自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng)，將機(jī)器學(xué)習(xí)的方式模擬人類(lèi)大腦的神經(jīng)元，當(dāng)處理的語(yǔ)言越來(lái)越多時(shí)，這種網(wǎng)絡(luò)就可以逐漸理解語(yǔ)言，實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)，這種技術(shù)可以使準(zhǔn)確率提升25%以上。

3、任何新技術(shù)都會(huì)經(jīng)過(guò)起步、發(fā)展、流行這樣的階段。

現(xiàn)階段最符合用戶(hù)習(xí)慣的交互方式是GUI，但GUI也是隨著智能手機(jī)的發(fā)展才逐漸流行起來(lái)。語(yǔ)音交互技術(shù)一旦解決了擬人化的問(wèn)題，賦予聲音情感化，強(qiáng)化人人交互的體驗(yàn)，就會(huì)進(jìn)一步促進(jìn)用戶(hù)習(xí)慣的養(yǎng)成。

4、語(yǔ)音交互有著其天然的用戶(hù)場(chǎng)景和用戶(hù)群體。

語(yǔ)音交互創(chuàng)造了全新的伴隨式場(chǎng)景，比如說(shuō)早晨起床后我們可以一邊洗刷一遍聽(tīng)廣播，晚上跑步的同時(shí)還可以聽(tīng)音樂(lè)，語(yǔ)音交互解放了人的手和眼睛，通過(guò)語(yǔ)音交互我們可以做到一心二用，這極大的提高了我們?cè)谀承﹫?chǎng)景下的效率，語(yǔ)音交互充分抓住了人類(lèi)不方便使用手和眼睛的場(chǎng)景。另外隨著智能設(shè)備影響的擴(kuò)大，用戶(hù)群逐步向老齡人群、低齡人群、身體殘障人群滲透擴(kuò)散的趨勢(shì)非常明顯，而對(duì)這些新進(jìn)入人群而言，原有的觸控交互方式或許并不太適合，用戶(hù)習(xí)慣也未形成，例如老年人視力下降、手指也不夠靈活；低齡兒童還不能掌握手寫(xiě)等能力也不適合長(zhǎng)時(shí)間看電子屏幕；弱視/盲人更希望接受語(yǔ)音信息和發(fā)出語(yǔ)音指令，等等，因此語(yǔ)音交互也更適合拓展智能設(shè)備新的用戶(hù)人群。

語(yǔ)音交互將成為物聯(lián)網(wǎng)時(shí)代最有競(jìng)爭(zhēng)力的入口。語(yǔ)音識(shí)別將使人機(jī)交互能夠以人類(lèi)最熟悉的方式進(jìn)行，語(yǔ)音識(shí)別技術(shù)一旦取得進(jìn)一步的突破，這個(gè)行業(yè)就會(huì)迎來(lái)黃金時(shí)期，而且語(yǔ)音交互將凌駕于瀏覽器、APP等其他應(yīng)用入口之上，形成一個(gè)以語(yǔ)音交互技術(shù)為核心的全新應(yīng)用生態(tài)鏈，同時(shí)對(duì)人工智能產(chǎn)業(yè)的發(fā)展起到極大的促進(jìn)作用。

可否想象么樣一個(gè)場(chǎng)景，在某個(gè)周日的早上，我們起床后，家里的智能音箱會(huì)自動(dòng)給我們播報(bào)今天的天氣狀況，吃早餐的時(shí)候發(fā)現(xiàn)冰箱里的牛奶只剩最后一盒了，只需要說(shuō)一句“再幫我訂購(gòu)一箱牛奶”，快遞就會(huì)在約定好的時(shí)間送過(guò)來(lái)，說(shuō)一句“幫我叫輛車(chē)”，一會(huì)車(chē)就到樓下等你了……

作者：有用先生，微信號(hào)：agoodesign，雜交設(shè)計(jì)師，產(chǎn)品狂熱分子，酷愛(ài)交互／界面／空間／品牌。

本文由 @有用先生原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

WOWDesign

專(zhuān)注B端金融用戶(hù)體驗(yàn)設(shè)計(jì)

34篇作品 369433總閱讀量

1688盯上會(huì)員經(jīng)濟(jì)，能否復(fù)制山姆超市的成功？

09-262619 瀏覽

感悟篇：我在B端做數(shù)據(jù)分析（二）

11-221773 瀏覽

如何有效開(kāi)展用戶(hù)體驗(yàn)層面的競(jìng)品分析？

07-176616 瀏覽

利用空閑時(shí)間設(shè)計(jì)了一個(gè)小程序「叫個(gè)羊毛」_V1.0_設(shè)計(jì)思路共享

11-162158 瀏覽

從Agent到多模態(tài)，大模型想要什么？

10-026199 瀏覽

評(píng)論

長(zhǎng)安小二

怎么總感覺(jué)最近人人上的語(yǔ)音交互是個(gè)噱頭，好多使用場(chǎng)景想象起來(lái)，感覺(jué)自己像個(gè)逗逼，智能像個(gè)智障。

最近來(lái)自廣東回復(fù)
1. WOWDesign 作者回復(fù)長(zhǎng)安小二
  
  技術(shù)規(guī)范還需要發(fā)展，用戶(hù)習(xí)慣和場(chǎng)景還需要培養(yǎng)，但是未來(lái)的趨勢(shì)，因?yàn)檎Z(yǔ)音在某些場(chǎng)景是最自然的方式，就像當(dāng)年的智能機(jī)出現(xiàn)
  
  最近回復(fù)
玩出花樣

感謝分享

最近回復(fù)
1. WOWDesign 作者回復(fù)玩出花樣
  
  感謝閱讀 ??
  
  最近來(lái)自日本回復(fù)
LxKirin

以我的普通話(huà)，很多時(shí)候，說(shuō)長(zhǎng)一點(diǎn)就會(huì)有錯(cuò)誤的出現(xiàn)，

最近來(lái)自湖南回復(fù)
1. WOWDesign 作者回復(fù)LxKirin
  
  哈哈，我的普通話(huà)也是這樣，給新技術(shù)一點(diǎn)時(shí)間，未來(lái)語(yǔ)音技術(shù)一定會(huì)超出我們的期望
  
  最近回復(fù)