從“躺進收藏夾吃灰”到“盤活知識用起來”——AI知識庫3.0升級方案設計

0 評論 5108 瀏覽 31 收藏 20 分鐘

在信息爆炸的時代,知識庫如何從“躺進收藏夾吃灰”到真正被用戶高效利用?本篇文章將深入解析 AI 知識庫 3.0 的升級方案,探討如何通過智能檢索、內(nèi)容優(yōu)化和交互設計,讓知識真正流動起來,提升用戶的學習與應用效率。

這是不是你?看到干貨文章瘋狂收藏,結(jié)果躺在收藏夾吃灰;想了解學習最新的AI工具,點進去卻被滿屏專業(yè)名詞勸退;充滿期待地點開《一分鐘教你用AI賺錢》,《3分鐘教你用AI生成10條短視頻,播放量百萬》,以為是“什么武功秘籍”,看完后才發(fā)現(xiàn)是九塊九包郵的”屠龍術(shù)”…

概括起來大家在做知識采集過程中,或多或少會遇到這幾個問題:

  • 沒時間去整理篩選資料
  • 不知道哪些適合閱讀
  • 部分文章專業(yè)性強看不懂/對我無用
  • 充斥標題黨營銷文篩選難
  • 資料收藏后閑置率高

關(guān)于AI知識庫之前已經(jīng)寫過2篇文章了,有興趣的小伙伴可以點擊鏈接考古:

一、方案的思考

總體方案思維導圖

整體方案我是從資料從哪里來、資料怎么整理、資料怎么應用三大方面思考拆解為以下腦圖:

1)資料來源

知識庫的素材來源有兩大路徑:一方面是希望由AI自動在網(wǎng)站上爬取,根據(jù)我設定好的規(guī)則篩選摘錄,另一方面是我自己平時看到覺得好的文章,按照規(guī)則摘錄進知識庫。由此可以梳理出以下兩條工作流:

2)資料規(guī)范

不管是人工或者是AI檢索的文章是很多樣的,需要按照統(tǒng)一的標準規(guī)范記錄到知識庫,這樣后續(xù)不論是自己看,還是檢索或者AI推薦閱讀文章規(guī)則,都有依據(jù)。這里我是根據(jù)我的使用習慣,設定了以下幾個字段。并據(jù)此在飛書中創(chuàng)建知識庫的多維表格。(對應表格中列表應該選擇的類型詳見下方截圖)

3)資料應用

AI可以替代人工去收集整理資料,但是無法替代人去學習。收集有用的資料進知識庫只是第一步,更重要的是后續(xù)要怎么用起來。這里我考慮了兩大場景,一方面是當用戶主動輸入需求發(fā)起檢索,另一方面是希望知識庫Agent能夠自動定時的推送,提醒用戶來閱讀。由此也梳理了對應工作流:

二、詳細的方案設計

智能體搭建平臺:Coze

搭建內(nèi)容:工作流(Workflow)X5,智能體X1

操作路徑:工作空間-資源庫-資源-工作流

平臺費用:創(chuàng)建免費,工作流運行時調(diào)用插件及大模型需消耗Token。平臺賬號可免費注冊,每日有免費Token額度,超額需充值

步驟1:創(chuàng)建人工精選文章整理工作流

目標及場景:當“我”看到覺得有價值的文章內(nèi)容時候,只需要給我的智能體發(fā)送文章鏈接,智能體就可以幫我通過文章鏈接,整理成對應的內(nèi)容,收錄進知識庫。

工作流節(jié)點:下圖是配置完成的工作流,除了必須的開始及結(jié)束節(jié)點外,主要包含4大節(jié)點:

  1. 鏈接讀?。哼@是一個插件,選擇[添加節(jié)點]后選擇[插件],在插件庫中選擇扣子官方提供的插件。它用于讀取文章鏈接中的全部信息,用于后續(xù)大模型的解析和內(nèi)容整理;
  2. 大模型①:主要用于分析整理內(nèi)容,下圖是該節(jié)點對應輸入和輸出的字段和格式。輸入內(nèi)容直接引用上一節(jié)點插件輸出的title和content字段,輸出的內(nèi)容對應的是后續(xù)要寫入知識庫(飛書表格)的字段。在大模型的提示詞中,我主要給它定義了4項任務:1)撰寫精煉摘要并過濾廣告信息;2)通過特征匹配將內(nèi)容歸類為5種專業(yè)主題或”其他”;3)按嚴格格式輸出包含標題、摘要、鏈接、類型、主題、時間的結(jié)構(gòu)化數(shù)據(jù),強調(diào)信息精準性、格式規(guī)范性和主題判斷的邏輯層次;

3.大模型②:主要是用于將大模型①輸出的字段,按照飛書文檔要求的傳入格式進行整理,這里也可以使用<代碼>節(jié)點進行替代;

4.飛書多維表格:這也是一個插件節(jié)點,在插件庫中,檢索“飛書”,找到下圖中的插件。app_token字段復制上前面創(chuàng)建好的文檔地址,records字段直接引用大模型②輸出的字段;

鏈接好工作流全部節(jié)點后,點擊試運行,隨便貼進一個文章的鏈接,看是否能夠運行成功,飛書多維表格返回“success”即代表寫入成功,即可點擊右上角發(fā)布;

步驟2:創(chuàng)建AI自動采集信息的工作流

目標及場景:AI可以固定頻次從高質(zhì)量網(wǎng)站(如:人人都是產(chǎn)品經(jīng)理)采集AI相關(guān)優(yōu)質(zhì)文章,按照我要求的格式整理進我的知識庫(飛書文檔)

工作流節(jié)點:下圖是配置完成的工作流,除了必須的開始及結(jié)束節(jié)點外,主要包含3大節(jié)點:

1.文章獲取:這是一個插件節(jié)點,可通過插件庫中檢索“人人都是產(chǎn)品經(jīng)理”,這個插件的能力是可以從人人都是產(chǎn)品經(jīng)理的網(wǎng)站,幫我一次性獲取到30條的熱門文章標題/熱度/時間/文章鏈接等。

同理,也可以選擇從別的平臺獲取文章的插件。我是覺得這個平臺始終堅持人工審核文章內(nèi)容,文章質(zhì)量和學習性比很多平臺高很多,而且熱榜是編輯團隊已經(jīng)審核并且受到眾多讀者喜歡的,篩選出來的文章質(zhì)量有一定的保證。

2.大模型:這里大模型節(jié)點,主要是用于篩選AI相關(guān)的文章。上一節(jié)點中30多條的熱門文章可能不都是AI相關(guān)的,所以這里在大模型提示詞中,要求它整理出與AI相關(guān)的文章鏈接。

3.循環(huán):添加循環(huán)節(jié)點包含循環(huán)及循環(huán)體兩大部分,循環(huán)體中是具體的循環(huán)動作,循環(huán)則控制了該節(jié)點輸入和輸出的字段。這里的循環(huán)節(jié)點,主要負責是將上一節(jié)點中大模型篩選出來的AI相關(guān)文章,逐條文章url進行解析,內(nèi)容提取分類,寫入飛書知識庫(這里的步驟和步驟1中創(chuàng)建的人工精選文章整理工作流一致,所以這里直接復用步驟1中的工作流)。在循環(huán)體中還有一個設置變量的節(jié)點,這個節(jié)點的目的是為了保證每一篇文章的url都需要遍歷這個流程而添加的。

鏈接完所有的流程,試運行成功后,點擊右上角發(fā)布工作流。

步驟3:創(chuàng)建用戶主動檢索工作流

目標及場景:當用戶輸入想要了解的內(nèi)容時,智能體可以檢索知識庫中的文章,整理推薦出最匹配用戶需求的文章。(實際呈現(xiàn)效果如下圖)

工作流節(jié)點:下圖是配置完成的工作流,除了必須的開始及結(jié)束節(jié)點外,主要包含2大節(jié)點:

1.表格內(nèi)容讀?。哼@是一個插件節(jié)點,通過插件庫添加,在插件庫中搜索飛書多維表格,找到下圖的插件選擇添加,app_token處輸入要讀取的多維表格鏈接。

2.大模型:這里我通過提示詞給AI的任務是,讓它通過剖析用戶查詢意圖,依據(jù)特定規(guī)則從知識庫篩選匹配文章,按評分機制計算總分并按規(guī)則推薦,還需在用戶有疑問時解釋評分依據(jù),按要求格式呈現(xiàn)至多 5 條推薦結(jié)果。下圖是我設計的推薦評分體系。

鏈接完所有的流程,試運行成功后,點擊右上角發(fā)布工作流。

步驟4:創(chuàng)建自動內(nèi)容推薦工作流

目標及場景:當用戶沒有主動要求檢索內(nèi)容時,Agent可主動觸發(fā)推薦最新收錄的文章,附上文章推薦語方便用戶篩選,點擊鏈接可直接跳轉(zhuǎn)閱讀原文。

工作流節(jié)點:下圖是配置完成的工作流,除了必須的開始及結(jié)束節(jié)點外,主要包含2大節(jié)點:

1.表格內(nèi)容讀?。哼@是一個插件節(jié)點,通過插件庫添加,在插件庫中搜索飛書多維表格,找到下圖的插件選擇添加,app_token處輸入要讀取的多維表格鏈接。

2.大模型:這里大模型的提示詞與步驟3中的有所不同,定義了它從指定知識庫中按收錄時間最近優(yōu)先、同收錄時間按發(fā)布時間由近及遠的規(guī)則篩選最新文章,結(jié)合摘要或主題內(nèi)容生成推薦語,按特定格式展示標題、鏈接及推薦語,無文章時告知用戶 “當前沒有可推薦的文章”。

鏈接完所有的流程,試運行成功后,點擊右上角發(fā)布工作流。

步驟5:創(chuàng)建文章內(nèi)容播客工作流

目標及場景:實現(xiàn)下班途中碎片化途中,播放文章內(nèi)容,提升知識庫資料利用率。(下圖是試運行的效果,最終會生成一個語音url)

工作流節(jié)點:下圖是配置完成的工作流,除了必須的開始及結(jié)束節(jié)點外,主要包含3大節(jié)點:

1.鏈接讀?。哼@是一個插件節(jié)點,通過插件庫添加,用于獲取鏈接中的內(nèi)容;

2.大模型:因為上一節(jié)點,插件會輸出很多的字段,需要整理成更流暢清晰的文本內(nèi)容;

3.文本轉(zhuǎn)語音:這也是一個插件節(jié)點,在插件庫中檢索“文本轉(zhuǎn)語音”即可找到,是扣子官方出的一個插件。test變量直接引用上一節(jié)點中大模型整理好的文本即可。

步驟6:創(chuàng)建智能體

目標及場景:為了方便后續(xù)的使用,需要創(chuàng)建一個智能體,通過設置提示詞,配置工作流及定時觸發(fā)任務,實現(xiàn)以上所有工作流的串聯(lián)和協(xié)同調(diào)用。

智能體任務:用下表整理了智能體要執(zhí)行的工作流和對應工作流執(zhí)行的條件;

智能體配置

1.添加插件:在插件欄添加兩大插件,獲取當前時間及連接讀取,這是為了讓智能體能夠識別用戶跟它對話的時間,當用戶給它發(fā)送文章鏈接時,可以先通過插件讀取內(nèi)容,判斷是否還有營銷賣課引流等信息,做初次篩選;

2.添加工作流:添加上述方案中所有配置好的工作流,以便智能體能清楚的知道后續(xù)要調(diào)用哪些工作流;

3.添加觸發(fā)器:這里配置了定時收集AI相關(guān)文章還有每日自動推薦文章內(nèi)容的兩條工作流,觸發(fā)器支持定時或者按照事件觸發(fā)兩種類型,這里用的是定時觸發(fā);

4.編排人設:在左側(cè)的人設與恢復邏輯中,定義好智能體的工作流,什么情況下調(diào)用什么工作流,具體的工作流用{{}}進行引用;

5.預覽與調(diào)試:在右側(cè)進行測試,確認完成后,點擊右上角發(fā)布;

心得分享

現(xiàn)在鋪天蓋地AI的資訊文章很多,越是在學習,越是感覺“知道的越多,知道的越少”。在摸著石頭過河中,我對于AI學習也有了一些心得:

AI學習要廣撒網(wǎng),但是一定要收線:AI領域的知識體系龐大且交叉性強,從自然語言處理(NLP)到計算機視覺(CV),從強化學習到多模態(tài)模型,底層邏輯相互關(guān)聯(lián)。每一個分支展開都是龐大的學習量,也都值得深入學習摸索。但是人的精力畢竟是有限的,如果廣而全最后只能狗熊掰棒子。自己要給自己定一條主線,根據(jù)主線再去找補齊主線的碎片化知識。(BTW這也是我為什么一直思考怎么迭代知識庫的原因。)這樣效率才會比較高,不會陷入迷茫。

AI是阿基米德的支點,不是神話中的阿拉丁神燈:AI不是神燈,只要許愿就能滿足所有需求,它本質(zhì)是“杠桿”,它只能放大人的能力,無法替代人的思考和判斷。AI 依賴于數(shù)據(jù)和算法,沒有高質(zhì)量的數(shù)據(jù),AI 模型就無法進行有效的訓練。同時AI 的決策是基于數(shù)據(jù)和數(shù)學模型它可能會出現(xiàn)錯誤或者偏差。部分營銷號鼓吹“AI一鍵生成爆款文章”、“掌握某某AI技術(shù),一夜暴富”看起來真的很吸引人,但是可能作者完全沒有體驗過,就吹得天花亂墜。面對此類資訊或者產(chǎn)出時,始終要有自己的判斷,不能盲信盲從。

沉淀才是護城河:AI淘汰的不是人,而是不會用AI的人。盡管AI技術(shù)迭代極快,但底層方法論和實戰(zhàn)經(jīng)驗會隨時間增值。通過撰寫技術(shù)筆記、復盤項目案例、構(gòu)建個人知識體系,才能在 AI 領域建立起屬于自己的壁壘。

本文由 @笛仁杰 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!