聊聊讓AI“聽懂人話”的秘密:意圖識別
從智能客服到智能家居,再到金融和醫(yī)療領(lǐng)域,意圖識別技術(shù)正幫助機器更好地理解人類的需求,并提供精準的服務(wù)。作者結(jié)合自身在大廠的工作經(jīng)驗,分享了如何通過意圖識別提升產(chǎn)品效率和用戶滿意度。
大家好,我是駱齊,目前在一家大廠負責(zé)一款千萬級用戶的AI 產(chǎn)品。
最近打算開個系列,把我在實際工作中踩過的坑、總結(jié)的干貨慢慢分享出來,今天就從 “意圖識別到底是什么”“它藏在我們生活的哪些角落” 開始講起。
平時和朋友聊起工作,最常被問的一句話就是:“為什么現(xiàn)在的 AI 好像越來越懂人了?我跟智能音箱說‘我好冷’,它不光能接話,還能默默把空調(diào)溫度調(diào)高,這到底是怎么做到的?”
其實背后的核心技術(shù),就是今天想跟大家好好聊聊的 ——意圖識別。
1.先搞懂:意圖識別,本質(zhì)是讓 AI “讀心”
很多人覺得 AI 技術(shù)很玄,但意圖識別的邏輯其實特別貼近生活。
簡單說,它的核心目的就是把我們用自然語言說的話、提的問題,精準翻譯成機器能聽懂的 “需求”,再轉(zhuǎn)化成具體的執(zhí)行動作,幫我們解決問題。
就像我朋友問的 “智能音箱調(diào)空調(diào)” 的例子:當(dāng)你說 “我好冷” 時,字面意思是 “表達寒冷”,但深層需求其實是 “希望改善寒冷的環(huán)境”。
這時候意圖識別模型要做兩件事:
第一,讀懂你沒明說的需求 ——“想要升溫”;
第二,觸發(fā)對應(yīng)的動作 ——“給空調(diào)發(fā)送調(diào)高溫度的指令”。
在我做產(chǎn)品的過程中,最有成就感的時刻,就是看到意圖識別把 “用戶說的話” 變成 “用戶想要的結(jié)果”。
比如之前優(yōu)化智能客服時,用戶發(fā)一句 “我買的裙子啥時候發(fā)貨”,模型能立刻識別出這是 “物流查詢” 意圖,自動調(diào)取訂單信息,3 秒內(nèi)就回復(fù) “你的訂單預(yù)計明天發(fā)貨”,不用用戶再等人工客服轉(zhuǎn)接,用戶滿意度一下就提上來了。
2.這些場景里,都有意圖識別在 “隱身工作”
其實意圖識別早就滲透到我們生活的方方面面了,只是很多時候我們沒意識到。
我結(jié)合自己做過的項目和觀察到的案例,整理了幾個最常見的應(yīng)用場景,大家看完可能會說:“原來這個也是意圖識別!”
第一個是智能客服與對話系統(tǒng)
這是意圖識別最 “出圈” 的場景,除了剛才說的物流查詢,還有售后問題。比如用戶說 “這衣服跟圖片色差好大”,模型能快速識別出這是 “售后投訴” 意圖,不會把它當(dāng)成 “咨詢衣服材質(zhì)” 來處理。
之前我們做過數(shù)據(jù)統(tǒng)計,加了意圖識別后,客服的問題分類準確率從 70% 提升到了 95%,用戶投訴的解決周期也縮短了一半 —— 畢竟機器先把問題 “分類歸位”,人工客服就能直接對接,不用再花時間問 “你是想投訴還是咨詢呀”。
第二個是物聯(lián)網(wǎng)與智能家居
這個場景里,意圖識別會更 “聰明”,因為它要結(jié)合環(huán)境數(shù)據(jù)來判斷需求。比如你晚上 10 點說 “有點冷”,模型會先看兩個信息:當(dāng)前時間(10 點,可能已經(jīng)睡覺了)、室外溫度(比如 10℃,屬于低溫)。
這時候它就知道,你的需求不是 “把空調(diào)溫度調(diào)高一點”(可能會太吵影響睡覺),而是 “開暖氣”—— 既安靜又能持續(xù)升溫。
第三個是金融和醫(yī)療領(lǐng)域
這兩個領(lǐng)域?qū)σ鈭D識別的精準度要求更高,因為涉及到用戶的核心利益。比如在醫(yī)療 APP 里,用戶說 “我咳嗽、發(fā)燒三天了”,模型會先識別出 “癥狀描述” 意圖,再結(jié)合醫(yī)學(xué)知識庫,初步判斷可能是 “上呼吸道感染”,然后推薦呼吸科或全科門診,不會讓用戶在幾十個科室里瞎選。
注意這類場景需要特別注意 “避免誤判”—— 比如用戶說 “我有點暈”,可能是低血糖,也可能是其他問題,這時候模型不會直接推薦科室,而是先追問 “是否還有惡心、心慌等癥狀”,再進一步識別意圖。
這種 “謹慎” 其實也是意圖識別的一部分:不是非要一次出結(jié)果,而是要在 “精準” 和 “用戶體驗” 之間找到平衡。
3.什么時候需要用意圖識別?它的工作鏈路是怎樣的?
很多做產(chǎn)品的朋友會問我:“我做的 APP 需要加意圖識別嗎?” 我的答案是:當(dāng)你的業(yè)務(wù)場景比較復(fù)雜,需要 “低成本理解用戶需求”,并 “精準調(diào)度功能 / 服務(wù)” 時,意圖識別就派上用場了。
簡單說,意圖識別就像一個 “初步分類器”。
以旅行APP為例,里面有天氣查詢、機票查詢、火車票查詢、酒店預(yù)訂、出入境政策查詢 5 個功能。
如果沒有意圖識別,用戶說 “我要后天從深圳飛北京”,系統(tǒng)可能會分不清你是要查機票,還是查北京的天氣,導(dǎo)致推薦錯服務(wù)。
但有了意圖識別,它就能先把你的需求 “歸類” 到 “機票查詢”,再觸發(fā)對應(yīng)的服務(wù),效率一下就上來了。
這里我拆解了一下意圖識別的完整鏈路,如下圖所示:
接下來我就用 “用戶查深圳飛北京機票” 這個例子,帶大家看看模型是怎么一步步工作的:
第一步是用戶提問
就是用戶在輸入框里寫的原始內(nèi)容,比如 “我要后天從深圳飛北京”。這一步很簡單,但問題在于,用戶說話往往會 “省略信息”,比如沒說 “查機票”,也沒說 “經(jīng)濟艙”,但這些都是關(guān)鍵信息。
第二步是意圖改寫
這一步是為了 “補全用戶沒說的話”,但前提是不改變原始意圖。比如剛才的提問,我們會改寫成 “查詢后天從深圳飛往北京的經(jīng)濟艙機票”。
為什么要加 “經(jīng)濟艙”?因為我們通過用戶行為數(shù)據(jù)發(fā)現(xiàn),80% 的用戶查機票時默認選經(jīng)濟艙,只有 20% 會明確要公務(wù)艙或頭等艙。
所以改寫時補全 “經(jīng)濟艙”,能讓后續(xù)的識別更精準。
第三步是意圖識別(槽位提?。?/h3>
這一步是把用戶的需求拆成 “一個個小格子”,我們叫 “槽位”。比如 “查詢后天從深圳飛往北京的經(jīng)濟艙機票”,可以拆成 4 個槽位:
這些槽位就像拼圖的碎片,只有把每個碎片都找對,后續(xù)的服務(wù)才能準確。比如如果出發(fā)地錯寫成 “北京”,那系統(tǒng)就會查 “北京飛深圳” 的機票,完全反了,所以槽位提取的精準度特別重要。
第四步是相關(guān)性判斷
這一步是確定 “該調(diào)用哪個服務(wù)”。我們的旅行 APP 有 5 個服務(wù),模型會給每個服務(wù)打一個 “相關(guān)性分數(shù)”,比如:
然后模型會選分數(shù)最高的 “機票查詢”,確定當(dāng)前意圖類別就是 “機票查詢”。
第五步是調(diào)度服務(wù)
最后一步就是通知后臺,調(diào)用 “機票查詢” 的接口,把 “深圳、北京、后天、經(jīng)濟艙” 這些槽位信息傳過去,系統(tǒng)就會給用戶展示對應(yīng)的機票列表了。
整個鏈路走下來,其實就像一個 “需求處理流水線”:從用戶說的一句話,到精準調(diào)出服務(wù),每一步都離不開意圖識別的 “穿針引線”。
4.結(jié)語
今天聊了這么多關(guān)于“意圖識別”的內(nèi)容,其實就是想試著把一項聽起來有點抽象的技術(shù),用更貼近現(xiàn)實的方式講明白。
我們常常覺得AI很“智能”,但這份智能背后,靠的往往是那些看似簡單、卻需要無數(shù)次打磨的技術(shù)細節(jié)——可能是一條意圖改寫的規(guī)則、一個槽位的精確定義,或者一次對相關(guān)性分數(shù)的細微調(diào)整。
作為從事AI產(chǎn)品相關(guān)工作的人,我一直相信,技術(shù)不是為了“炫技”而存在的。它的意義,在于真正扎根于人的需求。
比如,讓智能音箱更準確地理解你對“冷熱”的感受,讓客服機器人更快定位你的問題,讓旅行APP精準推薦你真正想要的那班飛機……這些看似微小的改善,才是意圖識別技術(shù)真正的價值所在。它不張揚,卻默默讓機器更懂人。
本文由人人都是產(chǎn)品經(jīng)理作者【產(chǎn)品經(jīng)理駱齊】,微信公眾號:【駱齊】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
太淺了,沒說意圖識別具體是怎么實現(xiàn)的