AI產(chǎn)品經(jīng)理轉(zhuǎn)型三部曲-技術(shù)篇②:《RAG和Markdown》
隨著AI技術(shù)的飛速發(fā)展,AI產(chǎn)品經(jīng)理的角色也在不斷演變。本文作為“AI產(chǎn)品經(jīng)理轉(zhuǎn)型三部曲”的技術(shù)篇第二部分,深入探討了RAG(檢索增強(qiáng)生成)技術(shù)和Markdown語法在AI產(chǎn)品開發(fā)中的應(yīng)用。
我們?cè)诖饲?a href="http://zhangjingwei.cn/ai/6219948.html" target="_blank" rel="noopener">《AI產(chǎn)品經(jīng)理轉(zhuǎn)型認(rèn)知篇-解構(gòu)本質(zhì)》中,提到大語言模型(LLM)就像一位知識(shí)淵博的 “超級(jí)大腦”,能與我們進(jìn)行自然流暢的對(duì)話,回答各種問題。
并且在《AI產(chǎn)品經(jīng)理轉(zhuǎn)型技術(shù)篇-LLM和Agent》中,我們也說到每個(gè)大模型都是擁有自己的訓(xùn)練集的,在預(yù)訓(xùn)練階段,大模型掌握了一定的知識(shí)和內(nèi)容。但是隨著這些大模型被越來越多的企業(yè)運(yùn)用,這些 “超級(jí)大腦” 如何快速、準(zhǔn)確地調(diào)用最新、最精準(zhǔn)的知識(shí)?
- 比如運(yùn)用到信用卡中心,它是否知道最新的卡有哪些?分別有什么賣點(diǎn)?積分如何兌換?
- 比如運(yùn)用到醫(yī)療領(lǐng)域,它是否能理解那么多醫(yī)療名詞?如何理解用戶的具體問題?
- 比如運(yùn)用到電商領(lǐng)域,它是否能知道最新的大促政策?哪些商品是爆品需要多推薦?
所以這就引申出來我們今天要說的第一個(gè)知識(shí)點(diǎn)
一、RAG
1.1 檢索增強(qiáng)生成的概念
傳統(tǒng)的大語言模型就像一位依賴 “死記硬背” 的學(xué)霸,通過海量數(shù)據(jù)訓(xùn)練將知識(shí) “刻入” 神經(jīng)網(wǎng)絡(luò)參數(shù)中。這種方式雖然能存儲(chǔ)大量信息,但存在兩大痛點(diǎn):
- 模型更新成本高,新知識(shí)的融入需要重新訓(xùn)練龐大的模型;
- 容易出現(xiàn) “幻覺” 問題,即生成看似合理卻不符合事實(shí)的內(nèi)容。
RAG 技術(shù)它引入了 “檢索” 機(jī)制,讓 AI 在回答問題時(shí),不再單純依賴自身的 “記憶”,而是先從外部知識(shí)庫(kù)中檢索相關(guān)信息,再結(jié)合自身的語言生成能力進(jìn)行回答。
檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)
是一種結(jié)合了信息檢索和文本生成技術(shù)的新型自然語言處理方法。RAG增強(qiáng)了模型的理解和生成能力。
RAG 基本上是 Search + LLM 提示,通過大模型回答查詢,并將搜索算法所找到的信息作為大模型的上下文。
如下圖:
查詢和檢索到的上下文都會(huì)被注入到發(fā)送到 LLM 的提示語中。(RAG的信息來源的范圍包括 LLM 未受過培訓(xùn)的互聯(lián)網(wǎng)上的新信息、專有業(yè)務(wù)背景或?qū)儆谄髽I(yè)的機(jī)密內(nèi)部文件。)
接下來我用一個(gè)簡(jiǎn)單易懂的例子來解釋下檢索增強(qiáng)生成。
你是一個(gè)粵菜廚師,你會(huì)做的菜基本上都是自己所學(xué)菜譜的菜式。
一天,你遇到一個(gè)廣東本地顧客;
顧客想吃白切雞,你查了一下菜譜大概就知道怎么做了,并且很快就能做好給到客戶。
你又遇到一個(gè)湖南客戶,他想吃家鄉(xiāng)正宗的辣子雞丁,他知道你是粵菜廚師,所以貼心的給你提供了自己所帶的網(wǎng)絡(luò)教程。
你結(jié)合自己原有的菜譜和客戶提供的教程,學(xué)習(xí)如何做這道菜,最終做好端給客戶。
假設(shè)我們是開發(fā)大模型的技術(shù)團(tuán)隊(duì),我們把大模型比作一名廚師。
在第一種情況下,“菜譜”就是我們?cè)陂_發(fā)系統(tǒng)的時(shí)候就配置好的知識(shí)庫(kù),因此廚師可以從系統(tǒng)默認(rèn)的知識(shí)庫(kù)中獲取白切雞的做法,然后做好給客戶。
在第二種情況中,假設(shè)我們的系統(tǒng)支持用戶上傳個(gè)性化資料,來更好地滿足個(gè)性化業(yè)務(wù)需要,當(dāng)客戶向廚師提供一份個(gè)性化菜譜,系統(tǒng)可以結(jié)合客戶的菜譜和自己的經(jīng)驗(yàn)結(jié)合做出新的菜品。
第一種方案的知識(shí)庫(kù),大家可以理解是公司統(tǒng)一配置的知識(shí)庫(kù),它相對(duì)固定,容易出現(xiàn)信息過期的問題;
第二種方案中,每個(gè)團(tuán)隊(duì)或者用戶,可以根據(jù)自己的需要來增加私域定制化知識(shí)庫(kù)。更靈活,不需要復(fù)雜的操作就能補(bǔ)充了業(yè)務(wù)知識(shí)。
我們給廚師準(zhǔn)備“其他菜譜”的過程就是建立知識(shí)庫(kù)索引,廚師查看資料就是系統(tǒng)在檢索知識(shí)庫(kù),基于檢索到的資料充分思考并回答用戶的問題就是做好的菜。
所以,簡(jiǎn)而言之,相比于預(yù)訓(xùn)練好的大模型;檢索增強(qiáng)生成可以通過添加來自其他數(shù)據(jù)源的上下文并通過培訓(xùn)補(bǔ)充大模型的原始知識(shí)庫(kù)來提高搜索體驗(yàn)的相關(guān)性。這增強(qiáng)了大型語言模型的輸出,而無需重新訓(xùn)練模型。
1.2 檢索增強(qiáng)生成的好處
1. 精準(zhǔn)度躍升:
我們經(jīng)常害怕大模型“一本正經(jīng)地胡說八道”;
前言中我舉例的醫(yī)療咨詢場(chǎng)景,比如患者詢問 “糖尿病患者的飲食禁忌”。傳統(tǒng)大語言模型可能因訓(xùn)練數(shù)據(jù)滯后,給出不完全準(zhǔn)確的建議;
而采用 RAG 技術(shù)的 AI,會(huì)先從權(quán)威醫(yī)學(xué)數(shù)據(jù)庫(kù)中檢索最新的糖尿病飲食指南,再結(jié)合指南內(nèi)容生成回答,給出諸如 “應(yīng)避免高糖指數(shù)食物,如白面包、糖果,建議多食用全谷物、綠葉蔬菜” 等精準(zhǔn)且專業(yè)的答案。
在金融領(lǐng)域,當(dāng)投資者咨詢 “近期某股票的走勢(shì)分析” 時(shí),RAG 技術(shù)能實(shí)時(shí)檢索最新的財(cái)報(bào)、行業(yè)動(dòng)態(tài)等信息,讓 AI 給出貼合實(shí)際的分析,而不是基于過時(shí)數(shù)據(jù)的錯(cuò)誤判斷。
2. 實(shí)時(shí)性突破:
讓 AI 緊跟時(shí)代步伐新聞資訊領(lǐng)域是體現(xiàn) RAG 實(shí)時(shí)性優(yōu)勢(shì)的典型場(chǎng)景。
在重大事件發(fā)生時(shí),配備 RAG 的 AI 可以實(shí)時(shí)抓取新聞網(wǎng)站、社交媒體上的最新報(bào)道,快速生成事件綜述和分析。
例如,當(dāng)有重要的科技發(fā)布會(huì),AI 能在短時(shí)間內(nèi)整合發(fā)布會(huì)的關(guān)鍵信息,以通俗易懂的語言向用戶解讀新產(chǎn)品的功能和意義,而無需等待模型進(jìn)行漫長(zhǎng)的更新訓(xùn)練。
3. 輕量化部署:
目前RAG技術(shù)被非常多企業(yè),尤其是傳統(tǒng)轉(zhuǎn)型AI的企業(yè)運(yùn)用的很大的原因是因?yàn)镽AG 技術(shù)無需像傳統(tǒng)模型那樣不斷擴(kuò)大參數(shù)量來提升性能。
企業(yè)可以根據(jù)自身需求,構(gòu)建小型、針對(duì)性強(qiáng)的知識(shí)庫(kù),搭配 RAG 技術(shù)實(shí)現(xiàn)高效的智能應(yīng)用。
例如,一家小型電商公司,只需將自身的商品信息、促銷政策等數(shù)據(jù)構(gòu)建成知識(shí)庫(kù),結(jié)合 RAG 技術(shù),就能快速搭建一個(gè)智能客服系統(tǒng),精準(zhǔn)解答用戶關(guān)于商品和優(yōu)惠活動(dòng)的問題,既降低了成本,又提高了服務(wù)效率。
4. 可解釋性增強(qiáng):
比如在醫(yī)療、法律、金融等對(duì)回答準(zhǔn)確性和可解釋性要求極高的領(lǐng)域,
當(dāng)用戶詢問 “如何進(jìn)行個(gè)人所得稅申報(bào)” 時(shí),RAG 不僅能給出詳細(xì)的申報(bào)步驟,還能附上相關(guān)的稅法條文鏈接和政策解讀來源,讓用戶清楚知道答案的依據(jù)。
這種可解釋性不僅增強(qiáng)了用戶對(duì) AI 回答的信任,也方便專業(yè)人士對(duì)回答進(jìn)行審核和驗(yàn)證。
1.3 RAG檢索增強(qiáng)的原理:
其實(shí)RAG的原理從文字描述上來說并不復(fù)雜,
主要分為三步驟:
建立索引、檢索、生成。
建立索引:
建立索引是 RAG 發(fā)揮作用的前置重要環(huán)節(jié)。
在這個(gè)過程中,系統(tǒng)會(huì)先對(duì)外部知識(shí)庫(kù)中的文本數(shù)據(jù)進(jìn)行預(yù)處理,比如去除特殊符號(hào)、轉(zhuǎn)換大小寫、分詞等操作,將原始文本轉(zhuǎn)化為計(jì)算機(jī)更容易處理的格式。
比如數(shù)據(jù)清洗和提取原始數(shù)據(jù),將 PDF、Docx等不同格式的文件解析為純文本數(shù)據(jù);
以及將文本數(shù)據(jù)分割成更小的片段(chunk);
最后將這些片段經(jīng)過嵌入模型轉(zhuǎn)換成向量數(shù)據(jù)(此過程叫做embedding),并將原始語料塊和嵌入向量以鍵值對(duì)形式存儲(chǔ)到向量數(shù)據(jù)庫(kù)中,以便進(jìn)行后續(xù)快速且頻繁的搜索。這就是建立索引的過程。
檢索生成:
檢索就比較好理解了,當(dāng)完成索引建立后,用戶提出問題,檢索生成步驟就開始運(yùn)作。
系統(tǒng)會(huì)先將用戶輸入的問題轉(zhuǎn)化為向量形式,然后在索引庫(kù)中檢索與問題向量相似度較高的文本片段。
在上一章我有解釋過K值,就是選擇相似度最高的K個(gè)文檔塊(K值可以自己設(shè)置)作為回答當(dāng)前問題的知識(shí)。
大語言模型基于自身的語言理解和生成能力,結(jié)合檢索到的可靠信息,對(duì)問題進(jìn)行綜合分析和整理,最終生成符合邏輯、準(zhǔn)確且有依據(jù)的回答。
二、Markdown基礎(chǔ)語法
在使用AI模型的過程中,尤其是需要做一些低代碼操作的時(shí)候,不得不提起Markdown語言;
Markdown是一種輕量級(jí)編輯語義,廣泛用于編寫格式化文本。
它的優(yōu)勢(shì)在于簡(jiǎn)單、易讀、適合撰寫文檔。
接下來我會(huì)帶大家認(rèn)識(shí)一些最常用的Markdown語法。
1.標(biāo)題
Markdown使用#表示標(biāo)題,#數(shù)量表示標(biāo)題的級(jí)別,最多可以有6個(gè)級(jí)別
比如:
2. 強(qiáng)調(diào)
使用星號(hào)或下劃線可以實(shí)現(xiàn)文本的加粗或斜體。
斜體:用單個(gè)星號(hào)或下劃線包圍文本
加粗:用雙星號(hào)或雙下劃線包圍文本
加粗斜體:用三個(gè)星號(hào)包圍文本
3.列表
無序列表使用星號(hào)、加號(hào)或減號(hào),后面跟空格;
有序列表則通過數(shù)字后面加·表示;
4.鏈接
創(chuàng)建鏈接使用[鏈接文本]+[鏈接url],記得使用英文括號(hào)
5.圖片
插入圖片的語法和鏈接鏈接類似,只是前面需要加個(gè)英文的感嘆號(hào)!
6.引用
使用>表示引用
7.代碼
行內(nèi)代碼使用反引號(hào)`包圍(可能會(huì)有小伙伴會(huì)問反引號(hào)怎么打,Windows 系統(tǒng)將輸入法切換為英文狀態(tài),直接按下鍵盤左上角的 “`/~” 鍵,即可打出反引號(hào)。)
8.分割線
使用三個(gè)或者更多的星號(hào)、減號(hào)、下劃線創(chuàng)建分割線。
以上都是markdown的核心語法,掌握后就可以請(qǐng)輕松寫格式化文本;markdown簡(jiǎn)單易學(xué),這在未來的提示詞工程中將會(huì)發(fā)揮非常大的作用。
預(yù)告:
我決定在這章結(jié)束后,下一篇,單獨(dú)專門寫提示詞工程,以及在提示詞中常見的技巧和使用痛點(diǎn),希望可以由淺入深的幫助大家慢慢學(xué)習(xí),一步一個(gè)腳印,知其然,知其所以然。
作者:Goodnight;工信部高級(jí)生成式AI應(yīng)用師;專注用戶研究、產(chǎn)品創(chuàng)新等領(lǐng)域
本文由 @Goodnight. 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒評(píng)論,等你發(fā)揮!