聊天機(jī)器人的技術(shù)原理和未來的發(fā)展

lll
0 評論 9635 瀏覽 28 收藏 9 分鐘

近年來,人工智能越來越火,那你們真的知道人工智能嗎?

一、人工智能是什么

人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。

李開復(fù) 對人工智能做過這樣的定義:

  • 首先是感知,包括視覺、語音、語言;感知可能是幫助識別一張圖里,一個嬰兒在沙發(fā)上抱著泰迪熊;
  • 然后是決策,包括識別、推薦、預(yù)測、判斷;比如GoogleNow通過你過去做的事情推測你接下去要做什么;
  • 最后是反饋,包括生成、機(jī)器人、自動化;比如無人駕駛汽車通過各種傳感器捕捉的信息后,用來做最后的決策——比如怎么去操作方向盤、油門、剎車等。

人工智能里面有很多先進(jìn)的技術(shù),自然語言處理、語音識別、計算機(jī)視覺等,下面,我們首先來了解一下自然語言處理技術(shù)以及其典型應(yīng)用。

二、自然語言處理應(yīng)用——聊天機(jī)器人

自然語言處理(NLP)是計算機(jī)科學(xué),人工智能,語言學(xué)關(guān)注計算機(jī)和人類語言之間的相互作用的領(lǐng)域。核心技術(shù)有機(jī)器翻譯、聊天對話等,主要的應(yīng)用有搜索引擎、問答系統(tǒng)等。

問答系統(tǒng)本質(zhì)上是一個信息檢索(IR)系統(tǒng),只是它從文本中獲取更多信息,返回更加精準(zhǔn)的答案。

傳統(tǒng)的問答系統(tǒng)將按照以下的流程工作:(1)問題解析(2)信息檢索(3)答案抽取。

典型的就是聊天機(jī)器人,一種自動的問答系統(tǒng)。模仿人的語言習(xí)慣,通過模式匹配的方式來尋找答案。在它們的對話庫中存放著很多句型、模板,對于知道答案的問題,往往回答比較人性化,而對于不知道的問題,則通過猜測,轉(zhuǎn)移話題,或者回答不知道的方式給出答案。

聊天機(jī)器人主要解決下面四個問題:

第一個怎么讓你的“女朋友”能聽你的話并想出應(yīng)該回復(fù)什么

針對內(nèi)容為導(dǎo)向的對話,系統(tǒng)中有內(nèi)容管理模塊,會在網(wǎng)上爬取信息,然后選取相關(guān)內(nèi)容進(jìn)行對話;

第二個問題是怎么樣進(jìn)行開放式的話題,讓聊天一直持續(xù)下去

在開放式話題上,該機(jī)器人需要涵蓋很廣的內(nèi)容,并且需要區(qū)分領(lǐng)域和話題。會首要響應(yīng)用戶的需求,同時將內(nèi)容推薦作為潛在任務(wù)來推進(jìn)對話的進(jìn)行;

第三個問題是怎么樣貼合用戶愛好,聊相關(guān)話題

聊天機(jī)器人以用戶為中心,以內(nèi)容為導(dǎo)向。構(gòu)建了為對話設(shè)計的知識圖譜,里面涵蓋了比較多樣化,高質(zhì)量的內(nèi)容,所以能進(jìn)行一些風(fēng)格多樣化的對話;

第四個是面對多樣的用戶是怎么讓各種用戶都滿意的?

根據(jù)對話的歷史以及內(nèi)容的屬性來選取最優(yōu)的策略進(jìn)行對話。通過心理學(xué)的問題來了解用戶的性格從而更好地進(jìn)行內(nèi)容推薦。

基本實(shí)現(xiàn)過程如下:用戶輸入數(shù)據(jù) -> 分析用戶意圖 -> 抓取關(guān)鍵參數(shù) -> 匹配最佳回答 –> 輸出回答。

基本原理就是我們的目標(biāo)給定輸入句子X,生成目標(biāo)句子Y,對輸入句子X進(jìn)行編碼,將輸入句子通過非線性變換轉(zhuǎn)化為中間語義表示C,根據(jù)句子X的中間語義表示C和之前已經(jīng)生成的歷史信息y1,y2……yi-1來生成i時刻要生成的單詞yi。每個yi都依次這么產(chǎn)生,那么看起來就是整個系統(tǒng)根據(jù)輸入句子X生成了目標(biāo)句子Y。

利用上述框架,聊天機(jī)器人可以根據(jù)用戶當(dāng)前輸入Message自動生成應(yīng)答Response,形成了一個有效的問答對話系統(tǒng)。

相對基于檢索類或者機(jī)器翻譯類傳統(tǒng)技術(shù)而言,基于深度學(xué)習(xí)框架的聊天機(jī)器人具有如下明顯優(yōu)點(diǎn)

  1. 構(gòu)建過程是端到端(End-to-End)數(shù)據(jù)驅(qū)動的,只要給定訓(xùn)練數(shù)據(jù)即可訓(xùn)練出效果還不錯的聊天系統(tǒng),省去了很多特征抽取以及各種復(fù)雜中間步驟的處理。
  2. 語言無關(guān),可擴(kuò)展性強(qiáng)。只需要使用不同語言的聊天數(shù)據(jù)進(jìn)行訓(xùn)練,不需要專門針對某種語言做相關(guān)的特定優(yōu)化措施,這使得系統(tǒng)可擴(kuò)展性大大加強(qiáng)。
  3. 訓(xùn)練數(shù)據(jù)擴(kuò)大有助于持續(xù)提升系統(tǒng)效果,一般通過不斷增加訓(xùn)練數(shù)據(jù)就能夠帶來持續(xù)的效果提升。

也存在下面缺點(diǎn)

  1. 評價標(biāo)準(zhǔn)方面還有待深入研究,很多工作是通過人工來進(jìn)行效果評價,還沒有特別合適的專用于聊天機(jī)器人的評價標(biāo)準(zhǔn),這是阻礙聊天機(jī)器人技術(shù)持續(xù)發(fā)展的一個障礙。
  2. 缺乏標(biāo)準(zhǔn)化的大規(guī)模訓(xùn)練數(shù)據(jù)。標(biāo)準(zhǔn)化的特大規(guī)模人與人對話數(shù)據(jù)相對缺乏。如果能夠有大規(guī)模的標(biāo)準(zhǔn)聊天數(shù)據(jù),很明顯將能夠極大促進(jìn)技術(shù)進(jìn)步。
  3. 技術(shù)仍處于發(fā)展初期。技術(shù)手段也好,實(shí)際系統(tǒng)效果也好,都有非常大的進(jìn)步空間。

三、聊天機(jī)器人的未來發(fā)展

聊天機(jī)器人已開始滲透到了我們的日常生活中,只不過,它們還沒有變成主流。電腦需要更好地理解人類的語言、情感和意圖。人工智能必須在幾個重要的方面獲得發(fā)展,才可能有機(jī)會得到廣泛的應(yīng)用。

1. 自然語言處理方面得到改善

聊天機(jī)器人越來越火,且應(yīng)用至各行各業(yè),微信、微博、QQ等眾多社交平臺紛紛選擇嵌入人工智能,尤其能理解對話的語境與語義的虛擬聊天機(jī)器人成為核心,得益于日益成熟的人機(jī)自然交互技術(shù),提升了用戶體驗(yàn)。

2. 了解消費(fèi)者

人工智能要發(fā)揮作用,最關(guān)鍵的問題就是理解背景信息。正如營銷和銷售會以360度的視角來了解消費(fèi)者,聊天機(jī)器人也需要更深入地了解它們互動的對象:他們是誰,他們是如何變成現(xiàn)在這個樣子的,他們在尋找什么,以及他們過去做過什么。

3. 閱讀人類的情感

如果聊天機(jī)器人能夠閱讀人類的面部表情或語音變化,從而理解與它們交流的人的情感變化,那么它們將無疑能夠提供更好的服務(wù)。聊天機(jī)器人現(xiàn)在只能應(yīng)付簡單的客戶服務(wù)。如果用戶感到失望或惱怒,那么聊天機(jī)器人可能需要將對話交給人類客服人員了。

 

本文由 @?lll 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!