聊天機(jī)器人的技術(shù)原理和未來的發(fā)展
近年來,人工智能越來越火,那你們真的知道人工智能嗎?
一、人工智能是什么
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。
李開復(fù) 對人工智能做過這樣的定義:
- 首先是感知,包括視覺、語音、語言;感知可能是幫助識別一張圖里,一個嬰兒在沙發(fā)上抱著泰迪熊;
- 然后是決策,包括識別、推薦、預(yù)測、判斷;比如GoogleNow通過你過去做的事情推測你接下去要做什么;
- 最后是反饋,包括生成、機(jī)器人、自動化;比如無人駕駛汽車通過各種傳感器捕捉的信息后,用來做最后的決策——比如怎么去操作方向盤、油門、剎車等。
人工智能里面有很多先進(jìn)的技術(shù),自然語言處理、語音識別、計算機(jī)視覺等,下面,我們首先來了解一下自然語言處理技術(shù)以及其典型應(yīng)用。
二、自然語言處理應(yīng)用——聊天機(jī)器人
自然語言處理(NLP)是計算機(jī)科學(xué),人工智能,語言學(xué)關(guān)注計算機(jī)和人類語言之間的相互作用的領(lǐng)域。核心技術(shù)有機(jī)器翻譯、聊天對話等,主要的應(yīng)用有搜索引擎、問答系統(tǒng)等。
問答系統(tǒng)本質(zhì)上是一個信息檢索(IR)系統(tǒng),只是它從文本中獲取更多信息,返回更加精準(zhǔn)的答案。
傳統(tǒng)的問答系統(tǒng)將按照以下的流程工作:(1)問題解析(2)信息檢索(3)答案抽取。
典型的就是聊天機(jī)器人,一種自動的問答系統(tǒng)。模仿人的語言習(xí)慣,通過模式匹配的方式來尋找答案。在它們的對話庫中存放著很多句型、模板,對于知道答案的問題,往往回答比較人性化,而對于不知道的問題,則通過猜測,轉(zhuǎn)移話題,或者回答不知道的方式給出答案。
聊天機(jī)器人主要解決下面四個問題:
第一個怎么讓你的“女朋友”能聽你的話并想出應(yīng)該回復(fù)什么
針對內(nèi)容為導(dǎo)向的對話,系統(tǒng)中有內(nèi)容管理模塊,會在網(wǎng)上爬取信息,然后選取相關(guān)內(nèi)容進(jìn)行對話;
第二個問題是怎么樣進(jìn)行開放式的話題,讓聊天一直持續(xù)下去
在開放式話題上,該機(jī)器人需要涵蓋很廣的內(nèi)容,并且需要區(qū)分領(lǐng)域和話題。會首要響應(yīng)用戶的需求,同時將內(nèi)容推薦作為潛在任務(wù)來推進(jìn)對話的進(jìn)行;
第三個問題是怎么樣貼合用戶愛好,聊相關(guān)話題
聊天機(jī)器人以用戶為中心,以內(nèi)容為導(dǎo)向。構(gòu)建了為對話設(shè)計的知識圖譜,里面涵蓋了比較多樣化,高質(zhì)量的內(nèi)容,所以能進(jìn)行一些風(fēng)格多樣化的對話;
第四個是面對多樣的用戶是怎么讓各種用戶都滿意的?
根據(jù)對話的歷史以及內(nèi)容的屬性來選取最優(yōu)的策略進(jìn)行對話。通過心理學(xué)的問題來了解用戶的性格從而更好地進(jìn)行內(nèi)容推薦。
基本實(shí)現(xiàn)過程如下:用戶輸入數(shù)據(jù) -> 分析用戶意圖 -> 抓取關(guān)鍵參數(shù) -> 匹配最佳回答 –> 輸出回答。
基本原理就是我們的目標(biāo)給定輸入句子X,生成目標(biāo)句子Y,對輸入句子X進(jìn)行編碼,將輸入句子通過非線性變換轉(zhuǎn)化為中間語義表示C,根據(jù)句子X的中間語義表示C和之前已經(jīng)生成的歷史信息y1,y2……yi-1來生成i時刻要生成的單詞yi。每個yi都依次這么產(chǎn)生,那么看起來就是整個系統(tǒng)根據(jù)輸入句子X生成了目標(biāo)句子Y。
利用上述框架,聊天機(jī)器人可以根據(jù)用戶當(dāng)前輸入Message自動生成應(yīng)答Response,形成了一個有效的問答對話系統(tǒng)。
相對基于檢索類或者機(jī)器翻譯類傳統(tǒng)技術(shù)而言,基于深度學(xué)習(xí)框架的聊天機(jī)器人具有如下明顯優(yōu)點(diǎn):
- 構(gòu)建過程是端到端(End-to-End)數(shù)據(jù)驅(qū)動的,只要給定訓(xùn)練數(shù)據(jù)即可訓(xùn)練出效果還不錯的聊天系統(tǒng),省去了很多特征抽取以及各種復(fù)雜中間步驟的處理。
- 語言無關(guān),可擴(kuò)展性強(qiáng)。只需要使用不同語言的聊天數(shù)據(jù)進(jìn)行訓(xùn)練,不需要專門針對某種語言做相關(guān)的特定優(yōu)化措施,這使得系統(tǒng)可擴(kuò)展性大大加強(qiáng)。
- 訓(xùn)練數(shù)據(jù)擴(kuò)大有助于持續(xù)提升系統(tǒng)效果,一般通過不斷增加訓(xùn)練數(shù)據(jù)就能夠帶來持續(xù)的效果提升。
也存在下面缺點(diǎn):
- 評價標(biāo)準(zhǔn)方面還有待深入研究,很多工作是通過人工來進(jìn)行效果評價,還沒有特別合適的專用于聊天機(jī)器人的評價標(biāo)準(zhǔn),這是阻礙聊天機(jī)器人技術(shù)持續(xù)發(fā)展的一個障礙。
- 缺乏標(biāo)準(zhǔn)化的大規(guī)模訓(xùn)練數(shù)據(jù)。標(biāo)準(zhǔn)化的特大規(guī)模人與人對話數(shù)據(jù)相對缺乏。如果能夠有大規(guī)模的標(biāo)準(zhǔn)聊天數(shù)據(jù),很明顯將能夠極大促進(jìn)技術(shù)進(jìn)步。
- 技術(shù)仍處于發(fā)展初期。技術(shù)手段也好,實(shí)際系統(tǒng)效果也好,都有非常大的進(jìn)步空間。
三、聊天機(jī)器人的未來發(fā)展
聊天機(jī)器人已開始滲透到了我們的日常生活中,只不過,它們還沒有變成主流。電腦需要更好地理解人類的語言、情感和意圖。人工智能必須在幾個重要的方面獲得發(fā)展,才可能有機(jī)會得到廣泛的應(yīng)用。
1. 自然語言處理方面得到改善
聊天機(jī)器人越來越火,且應(yīng)用至各行各業(yè),微信、微博、QQ等眾多社交平臺紛紛選擇嵌入人工智能,尤其能理解對話的語境與語義的虛擬聊天機(jī)器人成為核心,得益于日益成熟的人機(jī)自然交互技術(shù),提升了用戶體驗(yàn)。
2. 了解消費(fèi)者
人工智能要發(fā)揮作用,最關(guān)鍵的問題就是理解背景信息。正如營銷和銷售會以360度的視角來了解消費(fèi)者,聊天機(jī)器人也需要更深入地了解它們互動的對象:他們是誰,他們是如何變成現(xiàn)在這個樣子的,他們在尋找什么,以及他們過去做過什么。
3. 閱讀人類的情感
如果聊天機(jī)器人能夠閱讀人類的面部表情或語音變化,從而理解與它們交流的人的情感變化,那么它們將無疑能夠提供更好的服務(wù)。聊天機(jī)器人現(xiàn)在只能應(yīng)付簡單的客戶服務(wù)。如果用戶感到失望或惱怒,那么聊天機(jī)器人可能需要將對話交給人類客服人員了。
本文由 @?lll 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Pexels,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!