智譜的AtuoGLM實(shí)測(cè)–通用agent到來

0 評(píng)論 3365 瀏覽 3 收藏 20 分鐘

智譜清言近期發(fā)布的AutoGLM沉思,作為一款對(duì)標(biāo)OpenAI Operator的智能體產(chǎn)品,引發(fā)了廣泛關(guān)注。本文將為你帶來AutoGLM沉思的深度使用體驗(yàn),從其核心功能、實(shí)際應(yīng)用場(chǎng)景到操作感受,全方位剖析這款產(chǎn)品的優(yōu)勢(shì)與不足。

智譜在agent走的不快,但是很穩(wěn)!

3月31日,智譜在中關(guān)村上發(fā)布了它們的auto glm沉思,我也是第一時(shí)間使用,及時(shí)給大家更新這篇產(chǎn)品使用體驗(yàn),告訴大家這款對(duì)標(biāo)open AI的operater的GLM到底怎么樣

說到這,智譜其實(shí)在去年就發(fā)布了它們的glm產(chǎn)品,在發(fā)布會(huì)上,我們可以看到智譜可以幫助用戶導(dǎo)航、自動(dòng)購物或者寫好評(píng)等等,看起來十分炫酷。不過當(dāng)時(shí)還是處于內(nèi)測(cè)階段并沒有對(duì)外發(fā)布,只知道看完發(fā)布會(huì)的我是很震驚的,心想這么快已經(jīng)有這樣的產(chǎn)品出現(xiàn)了,讓我一度以為AGI真的不遠(yuǎn)了。

先說第一點(diǎn),智譜在這次發(fā)布會(huì)上,一共發(fā)布了兩個(gè)產(chǎn)品,第一個(gè)是沉思,第二個(gè)是沉思glm,嗯…….,聽上去差不多,但其實(shí)并不一樣

首先呢,沉思版本你可以理解為deep research,就是類似于Google和open AI的深度調(diào)研功能,用戶提出問題之后,它會(huì)根據(jù)用戶的問題不斷調(diào)用所需要的函數(shù)信息,來滿足用戶信息的需要,最大化使模型的回答質(zhì)量更佳的優(yōu)質(zhì),當(dāng)然了,這種也會(huì)更加的耗時(shí),因?yàn)槟P蜁?huì)根據(jù)用戶的問題來分析,然后不斷的尋找最優(yōu)解,什么意思呢?

比如,你現(xiàn)在想去西湖旅游,但是你根本不知道旅行路線,傳統(tǒng)方法你肯定要去各大平臺(tái)去挨個(gè)搜取信息,比如去抖音看博主怎么玩的,去小紅書看出行路線圖,然后在這個(gè)過程中你還需要不斷的翻用戶評(píng)論,深怕自己踩坑了或者被宰了,最后你經(jīng)過長(zhǎng)達(dá)一個(gè)小時(shí)或者一天的時(shí)間,你終于規(guī)劃出來一條自己認(rèn)為還不錯(cuò)的旅行路線,但是你已經(jīng)累趴了,就說你看到下面這種情況,你會(huì)不會(huì)窒息?反正我是直接b潰住了

但是現(xiàn)在,你只需要把這個(gè)問題,交給智譜的沉思或者任何帶有deep research的功能的大模型,它們會(huì)幫你解決這個(gè)問題,我這里現(xiàn)場(chǎng)實(shí)操一下

dangdangdangdang,一個(gè)智能版西湖旅游攻略就出來了,當(dāng)然了我覺得還是不足的,包括吃什么,咋哪里吃,怎么規(guī)劃時(shí)間路線和交通工具等等,不過這也是因?yàn)槲覜]有具體的prompt,如果大家想要有更好的出行計(jì)劃選擇,就需要給出完整的信息,比如預(yù)算啊,出發(fā)地啊什么的,這樣的效果會(huì)更好一些,而且從我使用體驗(yàn)來看,如果你想要選擇酒店的時(shí)候,你也可以利用沉思功能,根據(jù)目的地選擇便宜并且距離近的酒店,把它放在規(guī)劃里面。(友情提示:圖片里的一日游路線不要嘗試,這完全是把人類當(dāng)猴耍……)

另外,從深思的過程來看,它確實(shí)在很努力的搜集信息,看它不斷的查找,又不斷的否定自己,真的有在很努力的工作,是個(gè)和負(fù)責(zé)的打工人,甚至讓我有點(diǎn)心疼。

值得一提的是,盡管你要求它在抖音和小紅書里面搜索,但是它還會(huì)在別的平臺(tái)盡可能調(diào)用一些信息,我猜測(cè),可能智譜優(yōu)先地插件是知乎,因?yàn)槲以诿恳淮蔚脑囉盟暮瘮?shù)都有知乎,另外一方面可能是因?yàn)樗畲蠡瘽M足信息源所帶來結(jié)果的客觀性,避免過擬合。

沉思版本就將到這里,下面來講一講這次的重頭戲“沉思GLM”。

所謂沉思GLM,就是一個(gè)具有自主規(guī)劃、思考和行動(dòng)能力的agent,我相信大家對(duì)于agent都一定不陌生,我在這里列出了一個(gè)清單,結(jié)合目前市面上所有的agent,然后給出一個(gè)分類

需要提醒的是,這個(gè)分類是根據(jù)agent類目的一個(gè)整理,和我們之前看到的那種l1級(jí)別的AI劃分并不一樣,做這個(gè)表格的初衷是因?yàn)?,我發(fā)現(xiàn)agent這個(gè)詞在被濫用,行業(yè)內(nèi)可能都知道agent是什么意思,但是我身邊還有很多用AI的人,對(duì)于agent這個(gè)詞熟悉又陌生,在他們看來豆包的agent和manus好像都是一樣的,但為什么后者看上去難度就更大呢?

比如,我們說的agent一般都指第三種,也就是l3級(jí)別的,能基于大模型加上工具鏈,從而實(shí)現(xiàn)端到端的專業(yè)任務(wù)執(zhí)行,它的核心是規(guī)劃和執(zhí)行,這也是我們最近的研究和商業(yè)的重點(diǎn),市面上很多人工智能公司都在往這個(gè)方向發(fā)展,簡(jiǎn)單來說無論是manus還是智譜的glm本質(zhì)上都是一樣的,具備這種規(guī)劃和行動(dòng)能力,在未來無非就是朝著不斷的優(yōu)化發(fā)展,這里面有,速度響應(yīng)更快、幻覺更少、插件調(diào)用更多等等,所以這些工具給我們一個(gè)框架,證明這種模式行得通并且有效,也為以后的agent發(fā)展提供了一個(gè)清晰的路徑。

至于我們現(xiàn)在都在說的通用agent,我個(gè)人感覺是非常模糊的,主要是因?yàn)檫@個(gè)詞被大家用爛了,manus出來的時(shí)候我們說它是通用agent,現(xiàn)在誰家出來一個(gè)產(chǎn)品大家都要說是通用agent,就是在l3和l4之間來回徘徊,因?yàn)闆]有準(zhǔn)確的定義,或者公眾對(duì)于agi的期待太高,導(dǎo)致這個(gè)詞一直在被濫用

因此,拋開這些定義來看的話,結(jié)合這些agent的功能,我們可以給這些市面上agent工具做了一個(gè)區(qū)分,也是為了讓大家有一個(gè)更加清晰明了的認(rèn)知。

回到正題,來說一下這一次智譜的agent,根據(jù)官網(wǎng)所說這一次的,它們給其命名為auto glm,其核心突破在于實(shí)現(xiàn) “邊想邊干” 的自主任務(wù)執(zhí)行能力,推動(dòng) AI 從 “信息處理” 升級(jí)為 “目標(biāo)驅(qū)動(dòng)的行動(dòng)者”。

主要功能有三個(gè):

1,深度思考:基于 GLM-Z1-Rumination 沉思模型,模擬人類復(fù)雜決策過程。例如,處理 “分析 2025 年 Q2 互聯(lián)網(wǎng)大廠 AI 動(dòng)向” 時(shí),能自主規(guī)劃 “技術(shù)熱點(diǎn)梳理→網(wǎng)頁檢索→信息整合→報(bào)告生成” 的全流程,平均思考步驟超過 20 步。類似于open AI的o1.

2,感知世界:突破傳統(tǒng) API 限制,通過純前端視覺感知方案模擬人類操作。例如,可自動(dòng)登錄知網(wǎng)、小紅書等平臺(tái),抓取圖文信息并分析用戶真實(shí)評(píng)論,生成香港旅行攻略時(shí)能突破封閉內(nèi)容生態(tài)的信息壁壘。

這一點(diǎn)是比較有意思的,官方說的這種GUI閱讀能力,可以讓模型不斷的閱讀網(wǎng)頁內(nèi)容,擺脫傳統(tǒng)的API鏈接,什么意思呢?簡(jiǎn)單來說,以前我們做一個(gè)agent,想要獲取外部鏈接有以下幾種困難:

第一,你需要一個(gè)插件,如果沒有這個(gè)插件,你很難獲取到完整且合格的內(nèi)容,就拿扣子(coze)來說,我每次工作流都需要用到它的網(wǎng)頁插件來調(diào)取內(nèi)容,這就造成什么問題呢,不方便,比如你需要不斷的提醒a(bǔ)gent,再遇鏈接問題,要及時(shí)去調(diào)動(dòng),否則它可能會(huì)直接忽略,不具備自主能力。

第二,我們都知道人工智能時(shí)代,數(shù)據(jù)飛輪(數(shù)據(jù)飛輪是一種基于數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)增長(zhǎng)模型,其核心概念是通過不斷地收集、分析和利用數(shù)據(jù),來推動(dòng)業(yè)務(wù)各個(gè)環(huán)節(jié)的優(yōu)化和提升,從而形成一個(gè)正向循環(huán),促進(jìn)業(yè)務(wù)持續(xù)增長(zhǎng)。)的重要性,但是獲取數(shù)據(jù)是沒有那么簡(jiǎn)單的。

人工智能時(shí)代尤其是gpt出現(xiàn)的這幾年幾乎把互聯(lián)網(wǎng)20多年的數(shù)據(jù)跑完了,未來像小紅書、知乎、貼吧、抖音這種平臺(tái)的數(shù)據(jù)會(huì)越來越有價(jià)值,但是它們不會(huì)把這些數(shù)據(jù)給你的,那怎么辦呢?有同學(xué)說,爬蟲,先不說技術(shù)上能不能實(shí)現(xiàn)的同,即便你爬到了你也要面臨及其嚴(yán)峻的法律風(fēng)險(xiǎn),之前openai爬去烏克蘭一家電商公司,直接給對(duì)方網(wǎng)站整崩潰了,所以這在道道德上也說不過去,肯定不利于商業(yè)的長(zhǎng)期發(fā)展。

所以,智譜的使用方法是,我不調(diào)用,我也不爬蟲,我就直接看,我一邊瀏覽一邊抄,比如我就用它跑了幾個(gè)小紅書的案例,它就瘋狂的去幫我打開小紅書的網(wǎng)頁,中間除了讓我掃碼登陸(為了防止你不是真人),其他的都由他自主完成,完全沒有考慮我的感受,這家伙壞的很。

我這里隨便放一張圖,大家自行感受一下……..

3,工具使用:整合智譜自研的 AutoGLM 設(shè)備操作能力,支持網(wǎng)頁瀏覽、郵件發(fā)送、文檔生成等跨平臺(tái)任務(wù)。例如,接收到 “賺取 100 元” 的任務(wù)時(shí),能自主完成征稿啟事搜索、稿件撰寫、郵件投稿等操作。這點(diǎn)看上去很誘人,但是實(shí)際效果我們需要測(cè)試才知道。

那如何才能使用auto glm呢?

首先你需要打開官方網(wǎng)站,我把鏈接放在這里

https://autoglm-research.zhipuai.cn/#get_started

打開之后你會(huì)看到官方給出很多案例,感興趣的小伙伴可以觀看一下

接著你只需要看到下方的開始體驗(yàn)就行,很遺憾的事,目前autoglm是只能支持Google插件才能使用的,其他版本后續(xù)可能還會(huì)更新,所以google這一步需要大家自己解決。

這里提醒一下,大家在客戶端或者網(wǎng)頁端都是可以使用智譜的沉思的,無論你有沒有g(shù)oogle插件,只是說你想要用autoglm的話,你還需要進(jìn)行下一步地操作。

其實(shí)也很簡(jiǎn)單,就是你惦點(diǎn)擊下載之后,再把點(diǎn)擊google,選擇擴(kuò)展程序,點(diǎn)擊開發(fā)者模式,然后把這個(gè)文件拖入到google里面進(jìn)去,就可以了。

完成之后,你就可以在google的任何界面去隨時(shí)使用智譜,甚至在使用chatGPT的時(shí)候也可以(逆天了)

然后,這個(gè)時(shí)候你再打開智譜的時(shí)候,你就會(huì)神奇的發(fā)現(xiàn),你的頁面有一個(gè)新的功能,你可以點(diǎn)擊旁邊的沉思使用他們最新的研究功能,也可以點(diǎn)擊autoglm沉思,體驗(yàn)他們的agent。

那他們的智譜agent到底怎么樣呢?

我一共跑了5個(gè)case左右,實(shí)話講,效果一般,不如發(fā)布會(huì)和廣告那樣效果好,我身邊的幾個(gè)伙伴都測(cè)試了一下,幾乎都對(duì)其變現(xiàn)能力給出一般的評(píng)價(jià)。

但是人家其實(shí)也說了,目前是preview版本,很多功能還在測(cè)試,我個(gè)人覺得智譜的對(duì)agent的思考是有的,起碼這樣的一個(gè)框架是實(shí)現(xiàn)了的,規(guī)劃、思考和行動(dòng),都能鏈接在一起,只是說綜合起來可能還差點(diǎn)意思,但是不妨礙它仍然是一個(gè)很優(yōu)秀的作品。

比如,它的思考能力確實(shí)很好,前文我說過了,當(dāng)你在輸入問題的時(shí)候他會(huì)不斷的進(jìn)行分析,然后篩選信息,在進(jìn)行自動(dòng)化操作,這一部分就是相當(dāng)于深度思考?深度研究?agent了。

比如,我下面這個(gè),我讓智譜去幫我搜集open AI的最近一周的相關(guān)帖子,它就真的在不斷的大量閱讀,不斷的翻,而不像我們說的那樣,走馬觀花似得

這里可以看出來,它在瘋狂的閱讀小紅書內(nèi)容。

順便把我的prompt放進(jìn)來,供大家參考

##你是一位OpenAI的公關(guān)團(tuán)隊(duì)人員,你現(xiàn)在閱讀最近一周關(guān)于小紅書的帖子,找出一位情緒化最嚴(yán)重的帖子,然后進(jìn)行友好的用戶回復(fù)

這里面,智譜autoglm一共進(jìn)行了這幾個(gè)步驟,先去分析問題,確定用戶想要問的是什么,然后執(zhí)行命令,打開小紅書,請(qǐng)求登陸,閱讀相關(guān)文章,然后判斷哪一個(gè)情緒化最嚴(yán)重,再代入人物視角,進(jìn)行回復(fù)

然后呢,它會(huì)選擇一篇帖子進(jìn)行回復(fù),你只需要點(diǎn)擊確定,然后就可以評(píng)論了,不過我目前使用起來,這個(gè)功能不穩(wěn)定,起碼我有一半的case都沒有自動(dòng)回復(fù)

其次來說一下,autoglm的插件調(diào)用功能還是很豐富的,就我目前使用下來,是可以打開地圖、天氣以及小紅書、抖音等等軟件內(nèi)容的,這里面需要提醒一下,即便你電腦沒有下載小紅書,你的autoglm照樣可以打開它,因?yàn)樗皇侵苯哟蜷_小紅書客戶端的,可以簡(jiǎn)單理解為不在一個(gè)圖層,所以影響不大。

比如,我用這個(gè)它去操作一下這個(gè)天氣功能

還不錯(cuò),我以為他會(huì)打開一些商業(yè)天氣網(wǎng)站,結(jié)果直接跳出來了中央氣象臺(tái),還是很官方的

我這里還是建議大家多跑跑case,也許會(huì)有一些新的發(fā)現(xiàn),畢竟還是免費(fèi)的,沒有限制使用?。?!光這一點(diǎn)就是最大的優(yōu)點(diǎn),直接點(diǎn)贊?。?!

但是,我還是要說一下autoglm的問題的,算是一些小建議:

首先,插件的調(diào)用問題很混亂,比如我想要智譜去在小紅書和抖音去找信息,但是它還是會(huì)跳轉(zhuǎn)到知乎或者別的平臺(tái),這就很不方便,萬一有些用戶在做需求調(diào)研的時(shí)候,只想看個(gè)別平臺(tái),而忽略某些平臺(tái),這樣就很不方便。

其次,當(dāng)autoglm在行動(dòng)的時(shí)候,用戶在使用別的軟件或者智譜的時(shí)候,會(huì)造成其后臺(tái)停止,這就很雞肋了,因?yàn)榧热皇亲灾餍袆?dòng),那我在進(jìn)行別的操作應(yīng)該完全不受限制,起碼glm需要有一個(gè)單獨(dú)獨(dú)立的窗口

最后,也就是這種agent通用的一個(gè)毛病,也是我最頭疼的,速度太慢,比如,我想要選找路線,明明只需要一個(gè)高德地圖的事,它卻拐彎抹角幾十分鐘,甚至還沒有解決好,那這樣我還不如自己導(dǎo)航來的快

起初我還以為我的prompt不夠明確,但是即便我提示它怎么做,它還是會(huì)照樣那樣做。。。。。。

我想要的是,belike,請(qǐng)你跟我這樣做,我就跟你這樣做的那種效果

最后的最后,希望大家積極嘗試,還是那句話,早用早享受,解放生產(chǎn)力,起碼讓glm去給我進(jìn)行一些需求分析和用戶調(diào)研,還是很方便的,畢竟我們刷抖音也是只是想刷抖音,工作這種事還是給AI比較好。

原來這才是打工人真正的護(hù)眼神藥,媽媽再也不用擔(dān)心我的眼睛了!

本文由 @施拉格e 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!