從沉思到執(zhí)行,AutoGLM 到底能否成為產品調研的好助手?
在人工智能浪潮中,AutoGLM 作為一款備受矚目的產品,聲稱能實現“一邊想一邊干”的強大功能。然而,它是否真的能成為產品調研的好助手?本文作者通過親身實踐,從多個維度對 AutoGLM 進行了深度測試與分析,供大家參考。
媒體宣傳說智譜清言可以“一邊想一邊干”,于是我立刻申請內測,開始使用 AutoGLM,期盼它能自主運行,幫我訂一杯奶茶。結果是它只是幫我打開了美團網站,輸出了一堆沒用的信息,奶茶依然留在了奶茶店,沒有出現在我的桌面上。
我隨后又嘗試了官網宣傳的“訂酒店”功能,結果還是一長串搜索與分析,最終也沒有真正幫我完成酒店預訂。
最終,我放棄了它“干”的功能,轉而測試它“想”的能力,嘗試用它來做一些深度分析。
從官網的用例來看,目前 AutoGLM 的核心功能,個人認為還是集中在 Deep Research 層面。我下載了 mac 版本的桌面應用,同時也下載了 Chrome 的 AutoGLM 插件。從插件的信息來看,支持自動運行的網站包括知乎、微博、百度等十幾個網站。正如官網所說,目前該產品功能仍處于實驗階段,期待后續(xù)能夠真正實現“一句話訂酒店”的愿景。
我測試了一個“節(jié)假日西安周邊游”的出行規(guī)劃。從它的思維鏈可以看出,它的 workflow 包括:常規(guī)搜索、AutoGLM 搜索、工具調用、內容思考、總結輸出。首次在小紅書上的搜索失敗,隨后改用搜索引擎進行全局搜索。通過 tool observation 獲取信息,從知乎、小紅書、抖音等社交媒體進行詳細搜索。
在搜索過程中,它會自動啟動 Chrome 瀏覽器,可以看到 AutoGLM 的操作過程,比如調整小紅書搜索帖子的過濾器,從“綜合”調整為“最熱”。操作過程中,瀏覽器會出現藍色光暈閃現,表示正在工作中。
大約 10 分鐘后輸出了一份行程規(guī)劃。但結果價值不大。因為是節(jié)假日,必然會遇到交通擁堵等問題,本應提前規(guī)劃自駕路線,而報告中并未提供相應的出行路線規(guī)劃。
官網介紹視頻講解了 AutoGLM 的技術路徑:從通用基座模型 GLM-4,到推理能力大幅提升的 GLM-Z1-Air,再到強化學習訓練出“沉思”能力的 GLM-Z1-Rumination,最終融合為 AutoGLM 的執(zhí)行力。于是我開始橫向對比它的“沉思能力”。
這幾天我在研究 AI 在電子閱讀器中的應用情況,于是隨手用 AI 來做一份產品市場分析,用類似 AutoGLM 的“沉思”功能來測試它的思考整合能力到底如何。
在 Mac 客戶端中輸入 Prompt:“分析目前電子閱讀器 AI 應用的情況,從產品功能、定價策略、用戶評價、更新日志、社交媒體監(jiān)聽(受歡迎程度、用戶反饋以及互動情況)、App Store / Google Play Store 數據分析(下載量、評分、評論內容、更新頻率)等方面進行調查,必須依據最新的數據進行分析;另外分析未來 AI 在電子閱讀器領域的應用趨勢。”
盡可能讓 Prompt 思考得更全面,并橫向對比其他 AI 模型的推理能力。
輸入 Prompt 后,客戶端開始工作,首先進行免責申明,提示目前仍處于實驗階段。隨后進行常規(guī)搜索,第一步完成推理后,生成搜索關鍵詞。接著提示我確認品牌,我補充輸入:“以亞馬遜等主流品牌為基礎研究,地區(qū)以歐美為主,中國為輔進行分析?!盇utoGLM 再次搜索關鍵詞,并在推理與搜索過程中自動啟動了 Chrome,讓用戶實時看到其搜索流程。說實話,第一次看到它自動彈出網頁并演示自動搜索過程還挺新鮮,但如果一直這樣操作,就會影響用戶體驗。在用戶進行多任務工作時,突然開啟大量網頁,不僅無實際幫助,反而還需要用戶手動關閉,增加負擔。
報告輸出后,內容依然逃不過“大而全、泛泛而談”的通病,對我需要的信息闡述不夠細致,倒是展示了一堆額外信息。尤其是在數據范圍方面并未詳盡說明,比如價格和 Google Play Store 的數據分析基本缺失,提示無法獲取相關數據。我理解這可能是因為智譜的網絡環(huán)境限制了訪問 Google 網頁。
對比 ChatGPT-4o 的 Deep Research,它給的數據相對更“詳盡”,對數據的解讀也較為到位。用戶評論總結有據可依,關鍵結論都附有網頁鏈接,節(jié)省了二次搜索驗證的精力。
而 Gemini 的 Deep Research 表現介于兩者之間,雖然提供了數據描述,但沒有像 ChatGPT 那樣結構化地以表格形式清晰呈現。不過也提供了基本的數據與分析。從這個角度來看,ChatGPT 在這一項指標上勝出。
再來看 Manus 的表現,它同樣提供了數據,并以結構化的方式進行了總結分析。對于常規(guī)研究,這些信息基本夠用。目前給出的分析細節(jié)與數據可信度略低于 ChatGPT。
AI 對現有數據的整合能力很強,但對未來的預測仍然是基于現有數據的衍生與推演,我們也做了一些測試。
關于未來電子閱讀器 AI 的應用分析,ChatGPT 給出了幾個方向:
1.閱讀器從“被動呈現”轉向“主動交互”。AI 可以成為閱讀伙伴,與讀者共同探討閱讀內容。這是一個有趣的方向,但我個人認為閱讀更偏向沉浸式體驗,頻繁交互可能反而影響體驗。
2.AI 覆蓋整個閱讀流程,從“讀前-讀中-讀后”全流程滿足用戶細分需求。這對于產品設計初期是很好的創(chuàng)意來源。
3.更自然的語音交互。這項發(fā)展已經非常接近現實,可能會對有聲讀物市場產生一定沖擊。
4.推動端側模型和云端模型的結合。類似手機產品,會有越來越多的 AI 功能通過端側模型處理,進而推動硬件處理器發(fā)展。
此外,還有一些總結性的風險提示。
AutoGLM 的“沉思”功能提供的方向相對概括:
1.個性化體驗
2.深度理解
3.多模態(tài)交互
4.跨設備同步
5.社交閱讀
但整體分析偏簡單,缺乏足夠細節(jié)來“令人信服”。感覺像是“為了 AI 而 AI”。這些總結點目前主流閱讀器已有實現,沒有提出令人眼前一亮的新點子,顯得平庸。對產品設計前期的頭腦風暴也沒能提供有力支持。
再來看 Gemini 提出的方向:
1.更智能的內容推薦
2.更自然的交互方式
3.增強的語言學習功能
4.AI 驅動的文本分析與理解
5.更強大的輔助功能
6.更互動的動態(tài)電子書
看完 Gemini 的分析,以及雖然沒有展示但已測試的 Manus,可以看出各家對未來的預測已趨同,本質上并無太大差異。這說明,AI 能提供全面概括,但真正挖掘新的 AI 需求,仍需“以人為本”的體感洞察。
我們再來看下 Manus 的表現,它同樣給出了數據,并且以結構化的進行了總結分析,對于常規(guī)性的研究,這些信息基本夠用,目前給出的分析細節(jié)及數據可信度略低于 ChatGPT 。
綜合來看,AutoGLM、ChatGPT、Manus、Gemini 對產品調研確實有積極作用。在傳統(tǒng)桌面調研路徑中,AI 節(jié)省了大量時間和精力,能夠輕松獲取基礎產品信息。同時,AI 的智能性也可扮演產品助理角色,補充我們的思路。但在涉及定性層面研究時,仍需要“人肉”調研,真實使用產品、觀察用戶、聆聽用戶聲音,才能深入挖掘產品需求。
我認為 AutoGLM 的優(yōu)勢,最終還是應聚焦在能夠 執(zhí)行用戶操作 的任務上,比如電子購物、智能填表等。如果它能在執(zhí)行力方面做出差異化,才能在眾多思維鏈 AI 產品中脫穎而出。
本文由 @Antonio 原創(chuàng)發(fā)布于人人都是產品經理。未經作者許可,禁止轉載
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發(fā)揮!