為什么我覺得Gemini才是最適合普通人的Ai大模型

0 評(píng)論 5608 瀏覽 9 收藏 20 分鐘

對(duì)于普通用戶來說,我們真的需要一個(gè)無所不能的大腦嗎?本文將從體驗(yàn)維度出發(fā),梳理Gemini為何成為更貼近人、而非高高在上的AI伙伴,并探討“適合大眾”的真正標(biāo)準(zhǔn)。

作為一名用戶研究員,我的整個(gè)職業(yè)生涯都在試圖理解一件事,人究竟是如何與技術(shù)互動(dòng)的。我們通過訪談、觀察和數(shù)據(jù)分析,繪制用戶的行為旅程圖和共情地圖,努力去探尋每一個(gè)點(diǎn)擊、每一次停留、每一聲贊嘆或嘆息背后的“為什么”。我們總是在尋找那個(gè)“啊哈!時(shí)刻”,那個(gè)用戶恍然大悟、產(chǎn)品價(jià)值得以彰顯的瞬間。我們習(xí)慣于將自己抽離出來,以一種第三方的、力求客觀的視角,去審視人與屏幕之間那塊小小的、卻又無比復(fù)雜的場(chǎng)域。

但過去的這一年多,我發(fā)現(xiàn)自己前所未有地成為了一個(gè)典型的、甚至有些極致的研究對(duì)象。AI大模型的浪潮以一種不容分說的姿態(tài)席卷而來,我像無數(shù)知識(shí)工作者一樣,懷著興奮、好奇和一絲難以言說的職業(yè)焦慮,一頭扎了進(jìn)去。我不再僅僅是那個(gè)在單向鏡后面觀察的用戶研究員,我就是那個(gè)坐在屏幕前,與一個(gè)深不可測(cè)的“黑箱”進(jìn)行高頻次、高強(qiáng)度互動(dòng)的用戶。我的工作流被它野蠻地闖入并重塑,我的信息獲取方式被它徹底顛覆,我的情緒,也開始因?yàn)樗拿恳淮位貞?yīng)而起伏。

這篇文章,就是我對(duì)自己這段“用戶旅程”的一次深度復(fù)盤和自我剖析。我曾是ChatGPT Plus最忠實(shí)的首批訂閱用戶之一,累計(jì)花費(fèi)數(shù)千元,一度堅(jiān)信它在業(yè)界的領(lǐng)先地位無可撼動(dòng)。但最終,在經(jīng)歷了無數(shù)次的嘗試、失望、驚喜和理性的權(quán)衡之后,我?guī)缀鯇⒆约?0%的核心工作流,都遷移到了Google的Gemini上。這個(gè)轉(zhuǎn)變并非一蹴而就,它充滿了曲折。

我想從一個(gè)用戶研究員的視角,聊聊這個(gè)選擇背后的“為什么”。這不僅僅是關(guān)于哪個(gè)模型更“聰明”的技術(shù)跑分對(duì)比,更是關(guān)于一個(gè)核心的、常常被技術(shù)狂熱所忽略的議題,那就是信任。在人機(jī)協(xié)作的時(shí)代,一個(gè)工具的終極價(jià)值,最終取決于我們能在多大程度上信任它。

我依然清晰地記得,當(dāng)我第一次讓ChatGPT幫我分析一份用戶訪談?dòng)涗洉r(shí)內(nèi)心的震撼。那是一份長(zhǎng)達(dá)30頁的逐字稿,按照傳統(tǒng)的工作方式,我需要花上至少半天時(shí)間反復(fù)閱讀、貼標(biāo)簽、做聚類分析,才能梳理出用戶的核心觀點(diǎn)和情緒脈絡(luò)。而當(dāng)時(shí),我僅僅用了一個(gè)簡(jiǎn)單的指令,“請(qǐng)幫我提煉這份訪談中,用戶關(guān)于A功能的正面、負(fù)面和中立反饋,并分別列出原話。”幾分鐘后,一份結(jié)構(gòu)清晰、引用準(zhǔn)確的摘要就呈現(xiàn)在了屏幕上。那一刻,我感覺自己仿佛擁有了一位不知疲倦、效率極高的研究助理。這種“魔法般”的體驗(yàn),迅速讓我成為了AI的擁躉和布道者。

很快,我成為了付費(fèi)用戶。從用戶心理的深層來看,我們?yōu)橐豁?xiàng)服務(wù)持續(xù)付費(fèi)時(shí),購買的到底是什么?表面上看,是更強(qiáng)的功能、更快的速度、更優(yōu)先的訪問權(quán)。但本質(zhì)上,我們購買的其實(shí)是一種確定性可預(yù)測(cè)性。我為ChatGPT Plus支付的每一筆月費(fèi),都是在為一種“穩(wěn)定輸出”的預(yù)期買單。我需要一個(gè)可靠的伙伴,在我需要它的時(shí)候,它總能給我一個(gè)至少70分的、符合邏輯基線的答案。這個(gè)答案可能不是最驚艷的,但它必須是可靠的,不會(huì)出現(xiàn)離譜的錯(cuò)誤,不會(huì)違背我下達(dá)的核心指令。這種可靠性,能讓我放心地將它嵌入到我緊湊的工作流中,作為一個(gè)穩(wěn)定的“生產(chǎn)力組件”。

在很長(zhǎng)一段時(shí)間里,ChatGPT確實(shí)做到了這一點(diǎn)。它像一個(gè)訓(xùn)練有素的助手,雖然偶爾會(huì)犯些小錯(cuò),但大體上你知道它的能力邊界和行為模式。你可以圍繞它的特性,去構(gòu)建自己的提問技巧和工作方法。這種人與機(jī)器之間形成的默契,是建立信任的第一步。我曾以為這種默契會(huì)一直持續(xù)下去,所以我毫不猶豫地續(xù)費(fèi),并向身邊的同事和朋友推薦。我投入的不僅是金錢,還有寶貴的時(shí)間和信任成本。

然而,從GPT-4o發(fā)布前后開始,一些微妙但致命的變化出現(xiàn)了。我賴以信任的“確定性”開始崩塌。我至今還記得一個(gè)讓我下定決心尋找替代品的晚上。當(dāng)時(shí)我正在處理一份十幾頁的用戶訪談?wù)枰狝I幫我快速提煉出關(guān)于某個(gè)特定功能點(diǎn)的所有正反向反饋,并分類列出。這是一個(gè)典型的、我過去曾無數(shù)次交給ChatGPT并且完成得很好的任務(wù)。但那一次,它給我的結(jié)果卻讓我哭笑不得。第一次,它只提煉了不到三分之一的內(nèi)容就草草結(jié)束,像一個(gè)急著下班的員工。我以為是我的指令不夠清晰,于是調(diào)整了提示詞,要求它“務(wù)必完整處理全文”。第二次,它倒是輸出了長(zhǎng)篇大論,但仔細(xì)一看,里面張冠李戴,把用戶A的觀點(diǎn)安在了用戶B身上,甚至還“創(chuàng)造”了一些訪談中根本不存在的反饋。

這種體驗(yàn),我稱之為“薛定諤的智商”。你永遠(yuǎn)不知道下一次提交請(qǐng)求后,會(huì)得到一個(gè)天才的回應(yīng),還是一個(gè)“人工智障”的敷衍。它時(shí)而秒回,但內(nèi)容空洞,邏輯混亂;時(shí)而思考良久,卻交出一份布滿事實(shí)錯(cuò)誤的報(bào)告。這種行為的隨機(jī)性,對(duì)于一個(gè)嚴(yán)肅的工作場(chǎng)景來說是致命的。從用戶研究的角度分析,這直接破壞了用戶的心智模型。用戶原本建立起的“我輸入A,它會(huì)輸出B”的穩(wěn)定預(yù)期被打破了。每一次交互,用戶都需要花費(fèi)額外的認(rèn)知資源去評(píng)估、去驗(yàn)證、去糾錯(cuò)。這極大地增加了認(rèn)知負(fù)荷。一個(gè)本應(yīng)為我減負(fù)的工具,反而成了需要我時(shí)刻提防和“伺候”的對(duì)象。

當(dāng)一個(gè)工具的行為模式變得難以預(yù)測(cè),它就不再是“工具”,而變成了一個(gè)“麻煩”。我為它支付的費(fèi)用,換來的不再是確定性,而是不確定性帶來的焦慮。那幾千塊的訂閱費(fèi),最終沒有成為我生產(chǎn)力的投資,反而像是一場(chǎng)代價(jià)高昂的“信任教訓(xùn)”。

信任崩塌之后,我開始了漫長(zhǎng)的“遷徙之旅”。我?guī)缀醢咽忻嫔纤兄髁骱托屡d的大模型都深度試用了一遍,包括Grok、Claude、Deepseek,當(dāng)然還有Gemini。我不再僅僅看那些技術(shù)評(píng)測(cè)報(bào)告上的跑分,而是把它們當(dāng)作一個(gè)個(gè)“候選人”,在我的真實(shí)工作場(chǎng)景中進(jìn)行實(shí)戰(zhàn)考驗(yàn)。在這個(gè)過程中,我發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象,這些AI模型,似乎都有著自己獨(dú)特的“產(chǎn)品性格”,就像一個(gè)團(tuán)隊(duì)里性格迥異的同事。

ChatGPT,就像一個(gè)才華橫溢但情緒極不穩(wěn)定的前任。你偶爾還能從它那里看到靈感的火花,適合在一些非嚴(yán)肅的、探索性的場(chǎng)景下進(jìn)行頭腦風(fēng)暴。但你絕對(duì)不敢把重要的、有明確交付標(biāo)準(zhǔn)的任務(wù)交給它,因?yàn)樗S時(shí)可能“發(fā)脾氣”,給你一個(gè)意想不到的“驚喜”或“驚嚇”。

Claude,給我的感覺一直像個(gè)嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)派。它的文字功底扎實(shí),尤其在處理文學(xué)性、人文社科類的長(zhǎng)文本時(shí),表現(xiàn)出的細(xì)致和優(yōu)雅令人印象深刻。但它似乎有些“高冷”,交互起來感覺有一點(diǎn)距離感。它適合做深度閱讀、文本精加工這類任務(wù),但對(duì)于需要快速、靈活響應(yīng)的日?,嵤?,則顯得有些“重”。

Grok,得益于X平臺(tái)的數(shù)據(jù),在處理實(shí)時(shí)信息和一些偏口語化、網(wǎng)絡(luò)化的內(nèi)容時(shí)有獨(dú)到之處。它最讓我印象深刻的是代碼能力,回答干脆利落,不拖泥帶水,有一種“能動(dòng)手絕不多說”的極客氣質(zhì)。它就像團(tuán)隊(duì)里那個(gè)總戴著耳機(jī)、默默寫代碼的同事,應(yīng)用場(chǎng)景相對(duì)垂直,是程序員的好幫手,但泛用性稍差。

Deepseek,作為后起之秀,給我最大的感受是“努力”。它的產(chǎn)出文本有時(shí)會(huì)有一種用力過猛的“華麗感”,但你能感覺到它在非常努力地理解和滿足你的要求。它是一個(gè)非常有潛力的選手,但作為一個(gè)“實(shí)習(xí)生”,它的知識(shí)廣度和處理復(fù)雜、模糊問題的穩(wěn)定性還有待時(shí)間的檢驗(yàn)。

這場(chǎng)橫評(píng),讓我對(duì)AI工具的認(rèn)知更加清晰。世界上沒有完美的工具,只有最適合特定場(chǎng)景和特定工作流的組合。而我的核心訴-求,是找到一個(gè)能夠承載我80%以上日常工作的、穩(wěn)定可靠的“主攻手”。在兜兜轉(zhuǎn)轉(zhuǎn)之后,我最終將我的主力錨定在了Gemini上。這個(gè)選擇并非因?yàn)樗谀骋粋€(gè)單點(diǎn)上做到了絕對(duì)的碾壓,而是它的綜合表現(xiàn)和核心特質(zhì),完美契合了我作為一個(gè)知識(shí)工作者對(duì)“可靠伙伴”的全部要求。

Gemini最先打動(dòng)我的,恰恰是它的“乏味”,一種由高度穩(wěn)定性和可預(yù)測(cè)性帶來的、令人安心的乏味。當(dāng)我把同樣一份訪談紀(jì)要交給Gemini處理時(shí),它不會(huì)給我?guī)怼绑@嚇”。它會(huì)忠實(shí)地、完整地按照我的指令去執(zhí)行。輸出的結(jié)果可能在措辭上不是最華麗的,但一定是邏輯清晰、事實(shí)準(zhǔn)確的。我讓它寫4000字,它就絕不會(huì)寫2000字交差。我讓它遵循特定的格式,它就會(huì)像一個(gè)嚴(yán)謹(jǐn)?shù)某绦騿T一樣,精確地匹配每一個(gè)標(biāo)簽。這種“聽話”和“不偷懶”的特質(zhì),讓我迅速找回了對(duì)AI工具的掌控感和安全感。

而真正讓我決定將工作流大規(guī)模遷移過來的,是它那高達(dá)100萬token的超長(zhǎng)上下文窗口能力,以及這項(xiàng)能力目前可以通過AI Studio等渠道免費(fèi)使用。對(duì)于一個(gè)用戶研究員來說,這簡(jiǎn)直是夢(mèng)寐以求的“超能力”。我們的工作,本質(zhì)上就是在海量的、非結(jié)構(gòu)化的文本信息中尋找模式和洞見。過去,受限于技術(shù),我們不得不將長(zhǎng)篇的訪談稿、日記研究、焦點(diǎn)小組記錄切割成小塊進(jìn)行分析,這個(gè)過程不僅繁瑣,而且極易丟失上下文之間的微妙聯(lián)系。

Gemini的超長(zhǎng)上下文徹底改變了這一點(diǎn)。有一次,我手頭有一個(gè)持續(xù)了半年的用戶日記研究項(xiàng)目,積累了十幾萬字的文本材料。我將所有內(nèi)容一次性上傳,然后向它提問,“請(qǐng)追蹤這位用戶從項(xiàng)目開始到結(jié)束,對(duì)我們產(chǎn)品‘離線功能’的態(tài)度變化,并列出所有相關(guān)的原文作為證據(jù)?!睅追昼姾?,Gemini交出了一份令我驚嘆的報(bào)告。它清晰地梳理出了用戶態(tài)度從最初的“充滿期待”,到中期的“因bug頻發(fā)而失望”,再到后期“新版本修復(fù)后重拾信心”的完整心路歷程,并且每一處轉(zhuǎn)折都附上了精準(zhǔn)的原文引用。這種跨越時(shí)間線的洞察能力,在過去是需要研究員花費(fèi)數(shù)天時(shí)間才能完成的,而現(xiàn)在,它變得輕而易舉。

另一個(gè)強(qiáng)大的用法,是直接從海量原始數(shù)據(jù)中生成用戶畫像。我曾經(jīng)嘗試將15份不同用戶的訪談稿,總計(jì)近20萬字的內(nèi)容,全部喂給它,然后下達(dá)指令,“請(qǐng)基于這些訪談,構(gòu)建一個(gè)核心用戶畫像,包含他的人口學(xué)特征、使用產(chǎn)品的目標(biāo)、核心痛點(diǎn)、以及能代表他想法的關(guān)鍵引言?!彼a(chǎn)出的用戶畫像,每一個(gè)細(xì)節(jié)都牢牢地扎根于我提供的數(shù)據(jù),沒有任何憑空的想象和發(fā)揮。這對(duì)于確保研究的客觀性和說服力,價(jià)值巨大。

除了強(qiáng)大的文本處理能力,Gemini依托谷歌搜索所帶來的實(shí)時(shí)信息整合能力,也常常在關(guān)鍵時(shí)刻發(fā)揮作用。做競(jìng)品分析時(shí),我不再需要手動(dòng)在幾十個(gè)網(wǎng)頁和報(bào)告之間切換。我可以問它,“請(qǐng)幫我分析一下競(jìng)品A和競(jìng)品B在最近一個(gè)季度的市場(chǎng)動(dòng)態(tài),并結(jié)合最新的財(cái)報(bào)數(shù)據(jù)和用戶評(píng)論,總結(jié)它們各自的優(yōu)劣勢(shì)?!彼苎杆僮ト〔⒄献钚碌木W(wǎng)絡(luò)信息,給出一份時(shí)效性極強(qiáng)的分析報(bào)告。這種能力,對(duì)于需要快速響應(yīng)市場(chǎng)變化的工作來說,是不可或缺的。

更讓我感到貼心的是它在交互上的一些細(xì)節(jié)。當(dāng)你向它詢問一個(gè)技術(shù)問題的解決方案時(shí),它基本都會(huì)給出至少2個(gè)以上的方案供你選擇,并且會(huì)像一個(gè)經(jīng)驗(yàn)豐富的技術(shù)顧問一樣,分析每個(gè)方案的優(yōu)劣,最后加上一句“我強(qiáng)烈建議你使用方案A,因?yàn)椤边@種帶有明確傾向性建議的互動(dòng)方式,極大地降低了我的決策成本。

在中文的理解和表達(dá)上,Gemini也表現(xiàn)出了明顯的優(yōu)勢(shì)。它的回答邏輯清晰,很少繞彎子,語言風(fēng)格非常自然,沒有很多國外模型常見的生硬“翻譯腔”。無論是撰寫正式的報(bào)告,還是起草一封輕松的郵件,它生成的文本都非常得體,幾乎不需要二次修改。有一次,我讓它解讀一句在中國網(wǎng)絡(luò)語境下頗為流行的梗,它不僅解釋了字面意思,還準(zhǔn)確地分析了其背后的文化現(xiàn)象和傳播路徑,那種對(duì)中文語境的深刻理解,是其他模型難以企及的。

當(dāng)然,沒有任何工具是完美的。Gemini偶爾也會(huì)有理解偏差,生成的代碼也需要人工審核。但關(guān)鍵在于,它的“下限”非常高,它的表現(xiàn)是穩(wěn)定的、可預(yù)期的。我可以放心地把它作為我工作流的基石,在此之上,再去搭配Grok的實(shí)時(shí)信息能力或Deepseek的代碼能力,形成一個(gè)高效、可靠、且成本可控的AI工具矩陣。

從最初的驚艷,到中途的失望,再到最終找到一個(gè)可以信賴的伙伴,我作為“用戶”的這段旅程,也讓我作為“研究員”有了更深的思考。我們正處在一個(gè)AI能力大爆炸的時(shí)代,模型的參數(shù)、跑分每天都在刷新。但對(duì)于廣大的普通用戶和知識(shí)工作者來說,我們真正需要的,或許并不是那個(gè)在所有單項(xiàng)測(cè)試中都名列第一的“全能冠軍”,而是一個(gè)穩(wěn)定、可靠、懂你、并且能無縫融入你生活的“得力助手”。

我們已經(jīng)度過了對(duì)AI感到新奇和“不明覺厲”的階段,正在進(jìn)入一個(gè)更務(wù)實(shí)的“人機(jī)協(xié)作”階段。在這個(gè)階段,工具的價(jià)值不再僅僅取決于它的峰值能力有多高,更取決于它的平均表現(xiàn)有多穩(wěn)定,它的行為有多可預(yù)測(cè),它能在多大程度上降低我們的認(rèn)知負(fù)荷,而不是增加我們的驗(yàn)證成本。

信任,這個(gè)在人與人之間無比珍貴的品質(zhì),如今也成為了衡量人機(jī)關(guān)系質(zhì)量的核心標(biāo)尺。我的選擇,從ChatGPT到Gemini,本質(zhì)上就是一次信任的遷移。當(dāng)一個(gè)工具讓你覺得可以依賴,你才會(huì)愿意將自己最重要的工作托付給它。而Gemini,正是用它那種近乎“乏味”的可靠性,一點(diǎn)一滴地,為我重建了這份寶貴的信任。

本文由 @蔣昌盛 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!