RAG全系列之《重排序 Rerank 》

0 評(píng)論 1286 瀏覽 0 收藏 5 分鐘

在RAG系統(tǒng)中,重排序(Rerank)是連接檢索與生成的關(guān)鍵一環(huán)。本文深入解析Rerank模塊的核心邏輯與主流技術(shù)路徑,結(jié)合實(shí)際應(yīng)用場(chǎng)景,幫助產(chǎn)品人理解如何通過(guò)重排序提升AI問(wèn)答系統(tǒng)的準(zhǔn)確性與響應(yīng)質(zhì)量。

向量化與重排序(rerank)是相輔相成的兩個(gè)模塊, 他們兩個(gè)搭配起來(lái),共同解決檢索準(zhǔn)確性的問(wèn)題。

  • 向量檢索的核心:在海量數(shù)據(jù)中,檢索與跟查詢內(nèi)容相近的內(nèi)容。一般稱為內(nèi)容召回。例如一次性召回 50 條內(nèi)容
  • rerank的核心:基于召回的內(nèi)容,再做更加精準(zhǔn)的排序。例如將上面 50 條內(nèi)容,做一次更加精準(zhǔn)重排序,獲取到 top10 內(nèi)容;

為什么rerank準(zhǔn)確這么重要?

生成答案的大模型,如果自己沒(méi)有訓(xùn)練的話,他都是通用的識(shí)別能力,對(duì)于公司/行業(yè)內(nèi)的專有名詞/特地話術(shù)的區(qū)分能力很差。

如果你給了準(zhǔn)確的知識(shí),他能夠生成準(zhǔn)確的答案,但是如果你給的非常接近的錯(cuò)誤的知識(shí),他分辨能力較差,非常容易生成錯(cuò)誤的答案。

rerank模型

本質(zhì)就是針對(duì)重排序特別訓(xùn)練的大模型。我自己最早搭建 demo 的時(shí)候,并沒(méi)有使用 rerank 模型,直接用一個(gè)火山 doubao 1.5模型, 讓doubao 1.5 直接針對(duì)內(nèi)容的相關(guān)性進(jìn)行排序。這個(gè)也讓我了解到了專門(mén)的 rerank 大模型到底改進(jìn)了什么?

  • 速度更快:如果是使用通用的大模型對(duì)內(nèi)容進(jìn)行排序,耗時(shí)會(huì)很長(zhǎng),doubao的模型基本都是20s+,如果參與rerank環(huán)節(jié)的引用知識(shí)更多,那么排序時(shí)間就更長(zhǎng)了。但是專門(mén)的rerank模型基本秒級(jí)就可以完成同等的排序
  • 排序分?jǐn)?shù)更穩(wěn)定:對(duì)于同一批知識(shí),大模型的排序結(jié)果每次排序結(jié)果不盡相同,當(dāng)你復(fù)現(xiàn)case的時(shí)候非常痛苦,但是專門(mén)的rerank模型排序結(jié)果是很穩(wěn)定的;

模型推薦

一般不是很難排序的模型 bge-m3就足夠了,模型本身小,運(yùn)行速度快。如果排序比較難的話, 可以嘗試 qwen rerank 8B 的模型,但是這個(gè)模型有點(diǎn)大,對(duì)于服務(wù)器配置要求比較高。

經(jīng)驗(yàn)總結(jié)與反思

希望大家能夠理解真正的原理,各個(gè)板塊存在的意義,不然很容易人云亦云。

真的需要向量化嗎?

向量化的時(shí)間相對(duì)來(lái)說(shuō)比較高,需要搞自己向量化數(shù)據(jù)庫(kù),選擇合適的向量化模型,但是我們真的有必要搞向量化嗎?

向量化其實(shí)主要是方便從海量數(shù)據(jù)中找到可能的候選內(nèi)容,供 rerank 使用。針對(duì)企業(yè)級(jí)場(chǎng)景,很多公司的內(nèi)容并沒(méi)有那么多,我們完全可以把所有的知識(shí)全量 rerank,直接獲取結(jié)果就好了。我自己測(cè)試 500 條知識(shí),rerank 的話幾秒就完成了,做個(gè)并發(fā)的話,速度會(huì)更快。

需要自己訓(xùn)練模型嗎?

通用的模型在理解一些行業(yè)專有名詞的時(shí)候,效果不佳。如果這個(gè)成為了效果的瓶頸了,再考慮做模型微調(diào)。一般情況下,選個(gè)市面上通用的 rerank 模型就夠用了。

微調(diào)的話,建議優(yōu)先訓(xùn)練 rerank 模型,因?yàn)樗亲罱K的決定性環(huán)節(jié)。如果rerank 效果好,向量化效果差,直接在向量化環(huán)節(jié)搞個(gè) top100,然后交由 rerank 進(jìn)行排序選出最好的 top10。

后續(xù)

上面聊的只是一路檢索,但是現(xiàn)在我們使用的基本都是多路檢索,后續(xù)再給大家介紹一下多路檢索,以及后續(xù)生成環(huán)節(jié)如何處理。

本文由 @尋走 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!