一張圖說(shuō)明AI智能體的底層框架邏輯
智能體(Agent)已經(jīng)成為我們生活中不可或缺的“小幫手”,從手機(jī)里的語(yǔ)音助手到各種自動(dòng)化工具,它們通過(guò)感知環(huán)境、分析信息、做出決策并執(zhí)行任務(wù),極大地提升了我們的生活和工作效率。然而,智能體的底層框架邏輯究竟是怎樣的?它如何實(shí)現(xiàn)從接收數(shù)據(jù)到輸出結(jié)果的全過(guò)程?
AI智能體是什么,有很多解釋?zhuān)覀冇靡粋€(gè)簡(jiǎn)單的邏輯說(shuō)明一下,
智能體 = 能干事的“小幫手”
想象你有一個(gè)小助手,它能幫你完成任務(wù),而且自己會(huì)動(dòng)腦子!它可能是:
- a、?? 機(jī)器人(比如掃地機(jī)器人,看到垃圾就吸走)。
- b、?? 手機(jī)里的軟件(比如天氣預(yù)報(bào)App,自動(dòng)告訴你明天要不要帶傘)。
- c、?? 游戲里的角色(比如《我的世界》的村民,自己種地、買(mǎi)賣(mài)東西)。
智能體能夠感知環(huán)境、分析信息、做出決策并執(zhí)行任務(wù)。它可以是虛擬助手、聊天機(jī)器人、自動(dòng)化工具,甚至是物理機(jī)器人。智能體的核心特點(diǎn)是自主性和智能化,能夠根據(jù)目標(biāo)獨(dú)立完成復(fù)雜任務(wù)。
智能體能夠通過(guò)接收文字、圖片、語(yǔ)音、視頻和各種外部傳感器接收數(shù)據(jù)。無(wú)論是文字、圖片、語(yǔ)音、視頻或者溫度、壓力、角度等都是一種數(shù)據(jù),這些數(shù)據(jù)最終轉(zhuǎn)化為計(jì)算器所能夠理解的信息。
然后再進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行分析,理解這些數(shù)據(jù)的含義
進(jìn)一步的,根據(jù)算法、策略規(guī)則對(duì)這些分析后的信息制定策略、決策
最終通過(guò)執(zhí)行機(jī)構(gòu)比如回復(fù)消息,去控制設(shè)備,去控制APP下訂單等方式做出反饋。
總結(jié)起來(lái),智能體就是一個(gè)能夠感知,分析決策,執(zhí)行反饋的幫手。
那是否有一張圖可以把智能體的邏輯講清楚的呢,其實(shí)是可以的。如下圖就將智能體的整體結(jié)構(gòu)給說(shuō)明白了。
普通人與智能體的交互其實(shí)就是一個(gè)對(duì)話(huà)界面,這個(gè)界面可能直接就是一個(gè)對(duì)話(huà)框,或者是一個(gè)數(shù)字人的分身,總之就是能夠進(jìn)行對(duì)話(huà)的,無(wú)論這個(gè)對(duì)話(huà)是文字,語(yǔ)音,還是視頻,還是上傳文件等方式。
然后用戶(hù)給智能體的信息,會(huì)由智能體進(jìn)行識(shí)別,另外再加上智能體已經(jīng)預(yù)先設(shè)置的提示詞(智能體Agent的人設(shè)),再加上一些內(nèi)容知識(shí)庫(kù)。
這些內(nèi)容用大模型進(jìn)行分析,如果有必要去調(diào)地圖、表單、搜索引擎等就會(huì)通過(guò)API方式去調(diào)用,并進(jìn)一步利用大模型分析,最終再利用生圖、生視頻、語(yǔ)音合成、3D內(nèi)容合成等將語(yǔ)言大模型的內(nèi)容進(jìn)一步輸出為需要的內(nèi)容類(lèi)型給到用戶(hù)。
整個(gè)過(guò)程就是用戶(hù)輸入的內(nèi)容+人設(shè)+知識(shí)庫(kù)+三方數(shù)據(jù)給到大模型,大模型進(jìn)行分析,再進(jìn)一步轉(zhuǎn)化為用戶(hù)需要內(nèi)容,最后輸出給用戶(hù)。輸入的是文字,輸出要語(yǔ)音,圖片,視頻等,就可以說(shuō)是多模態(tài)。
多模態(tài)可以簡(jiǎn)單理解為輸入的內(nèi)容形式和輸出的內(nèi)容形式不一樣,就是跨界了。
當(dāng)然這是我們的一個(gè)簡(jiǎn)單概述,實(shí)際里面的邏輯會(huì)比較復(fù)雜,后期將對(duì)智能體及大模型原理逐步展開(kāi),并介紹市面上的各種大模型工具,探討他們?nèi)绾螏椭覀兲嵘屎托б妗?/p>
本文由人人都是產(chǎn)品經(jīng)理作者【markzou】,微信公眾號(hào):【markzou的筆記】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!