8 大設(shè)計(jì)突破,定義 AI 未來
文章聚焦人工智能交互設(shè)計(jì)的八大突破,揭示創(chuàng)新界面與交互范式如何重塑人機(jī)協(xié)作。這些革新不僅重塑用戶體驗(yàn),更成為AI技術(shù)普及與進(jìn)化的關(guān)鍵引擎。
十多年來,我們首次迎來了用戶體驗(yàn)設(shè)計(jì)領(lǐng)域一片真正的 “藍(lán)?!?。沒有現(xiàn)成的手冊(cè),也沒有既定模式可遵循。就連前沿的 AI 實(shí)驗(yàn)室也在通過實(shí)驗(yàn)摸索,觀察新交互方式中哪些能引發(fā)共鳴。
這讓我想起了觸摸式移動(dòng)界面剛興起的時(shí)候,那時(shí)設(shè)計(jì)師們積極開創(chuàng)如今我們習(xí)以為常的交互模式。就像早期 iOS 和安卓的設(shè)計(jì)選擇塑造了移動(dòng)計(jì)算時(shí)代一樣,如今的突破正在定義未來數(shù)年我們與 AI 的協(xié)作方式。
看著這些設(shè)計(jì)選擇實(shí)時(shí)在生態(tài)系統(tǒng)中產(chǎn)生連鎖反應(yīng),實(shí)在是妙趣橫生。一旦某種設(shè)計(jì)行之有效,競(jìng)品就會(huì)競(jìng)相采用 —— 這并非偷懶,而是因?yàn)槲覀兌荚诠餐剿髟谶@個(gè)新范式下,究竟什么才是合理的。
在這個(gè)如同 “西部拓荒” 的時(shí)期,新的主流模式正在涌現(xiàn)。今天,我想重點(diǎn)講講那些最讓我眼前一亮的突破 —— 這些設(shè)計(jì)選擇正在重塑我們對(duì) AI 交互的整體認(rèn)知。其中一些現(xiàn)在看來可能稀松平常,但每一個(gè)都曾代表著關(guān)鍵的探索時(shí)刻,是一次成功的試驗(yàn),幫助我們更好地理解人類與 AI 如何協(xié)同合作。
通過研究這些有影響力的模式,我們就不再局限于照搬現(xiàn)成的成功經(jīng)驗(yàn),而是能夠引領(lǐng) AI 界面的未來走向。
上面是早期的ChatGPT,下面是其之前的開發(fā)者實(shí)驗(yàn)平臺(tái)
1.對(duì)話范式(ChatGPT)
關(guān)鍵洞察:人類早已熟知如何通過對(duì)話來表達(dá)復(fù)雜的想法 —— 何必讓他們?cè)偃W(xué)別的呢?
影響:將對(duì)話確立為人類與 AI 交互的基本范式
如今,聊天界面隨處可見,我們幾乎都不會(huì)特意去想它,但正是這個(gè)突破,把我們帶入了當(dāng)下這個(gè)時(shí)代。GPT 早已在 OpenAI 的開發(fā)者控制臺(tái)上線,可那個(gè)界面并未引起廣泛關(guān)注。它看起來、用起來都和其他開發(fā)工具沒什么兩樣。我記得自己擺弄過它,也確實(shí)印象深刻,但它并未讓我眼前一亮。
將底層技術(shù)轉(zhuǎn)變?yōu)閷?duì)話形式這一決策,徹底改變了局面。有意思的是,OpenAI 公司本身可能都沒太把這個(gè)改變當(dāng)回事。想想看,他們居然給它取名叫 ChatGPT—— 要是他們覺得自己在打造一款革命性的消費(fèi)產(chǎn)品,絕對(duì)不會(huì)選這么個(gè)名字。但事實(shí)證明,這是這一代最重要的設(shè)計(jì)選擇。從那以后,聊天界面被廣泛模仿,幾乎影響了之后所有面向消費(fèi)者的 AI 工具。
我曾經(jīng)以為聊天界面最終會(huì)逐漸消失,但現(xiàn)在不這么想了。這一波生成式 AI 工具全都以自然語言為核心,而對(duì)話是通過語言分享想法的主要方式。蹩腳的聊天機(jī)器人會(huì)不斷進(jìn)化,但對(duì)話作為一種基礎(chǔ)范式將會(huì)持續(xù)存在。
盡管在用戶界面方面很簡約,但引用功能卻是一大進(jìn)步
2.來源透明度(Perplexity)
關(guān)鍵洞察:若看不到信息來源,用戶就無法在研究中驗(yàn)證 AI 給出的回答。
影響:為搜索和研究工具中可驗(yàn)證的 AI 輸出設(shè)定了新的行業(yè)預(yù)期。
人們開始頻繁使用 ChatGPT 后,關(guān)于缺乏信息來源的抱怨便屢見不鮮。雖然 GPT 能依據(jù)其海量訓(xùn)練數(shù)據(jù)給出回答,但卻無法知曉這些信息從何而來,這使得它難以應(yīng)用于正規(guī)研究。
Perplexity 引入了對(duì) AI 回答的實(shí)時(shí)引用功能,讓答案變得可追溯、可驗(yàn)證,從而改變了這一局面。此后,這一功能被廣泛效仿,OpenAI 在 ChatGPT 中整合網(wǎng)頁搜索功能時(shí)也借鑒了這一點(diǎn)。它解決了一個(gè)根本性的信任問題:用戶不僅想要答案,還希望對(duì)答案的來源放心。
這一突破對(duì)于打消人們將 AI 用作新型搜索引擎的顧慮至關(guān)重要,但實(shí)際情況是,AI 的作用遠(yuǎn)不止于此。大語言模型(LLMs)不僅能提升像 Perplexity 這類問答式工具的性能,還為全新的創(chuàng)意工作流程打開了大門。
通過 “Artifacts”,對(duì)話驅(qū)動(dòng)創(chuàng)意產(chǎn)出
3.創(chuàng)意整合(Claude 的 Artifacts)
關(guān)鍵洞察:對(duì)話所能做的不僅僅是生成文本,還能推動(dòng)結(jié)構(gòu)化、可復(fù)用資產(chǎn)的創(chuàng)建。
影響:開啟了全新的創(chuàng)意工作流程,在這種流程中,對(duì)話能產(chǎn)生實(shí)實(shí)在在的成果。
使用 Artifacts 時(shí),我第一次感覺自己是在和 AI 積極創(chuàng)作些什么,而不只是單純地聊天。之前我和 ChatGPT、Claude 的交流對(duì)構(gòu)思很有幫助,Perplexity 在研究方面也很有用,但 Artifacts 讓我有了那種 “頓悟” 的時(shí)刻 —— 我可以從一場(chǎng)對(duì)話開啟創(chuàng)意工作流程,然后把其中最精彩的部分轉(zhuǎn)化為實(shí)實(shí)在在的成果,之后還能導(dǎo)出并再次使用。要通過這種基于對(duì)話的交互循環(huán),在創(chuàng)建完資產(chǎn)后輕松延續(xù)工作流程,我們還有一段路要走,但我們正朝著這個(gè)方向前進(jìn)。
對(duì)我來說,Artifacts 證明了與 AI 協(xié)作將成為全新創(chuàng)意工作流程的核心,也改變了我預(yù)期的交互模式:AI 不再只是輔助工具,與 Claude 的對(duì)話成了核心機(jī)制,能生成創(chuàng)意成果,然后我們一起完善。AI 不再僅僅是我的 “助手” 或 “副駕駛”,它越來越像是坐在駕駛座上的那個(gè)人了。
ChatGPT iOS 應(yīng)用程序的聽寫輸入功能
4.自然交互(語音輸入)
關(guān)鍵洞察:相較于打字,說話能實(shí)現(xiàn)更豐富、更自然的表達(dá)。
影響:降低了向 AI 提供詳細(xì)背景信息以及與之探討想法時(shí)的交互成本。
很多人仍然忽視語音作為一種輸入方式。我覺得大家都不太相信語音輸入能好用,這都怪過去那一代大多不太靠譜的語音助手(說的就是你,Siri)。但實(shí)際情況是,現(xiàn)在 AI 轉(zhuǎn)錄的效果已經(jīng)非常好了。
語音輸入之所以關(guān)鍵,是因?yàn)樗茏屇阏嬲褂米匀徽Z言。我們可能沒意識(shí)到,一旦開始把東西寫下來,我們就會(huì)開始自我修正。大聲說出來能讓大腦充分發(fā)揮即興創(chuàng)造力。這樣的輸出能給大語言模型(LLM)提供更豐富的背景信息 —— 而這恰恰是大語言模型所擅長處理的。我覺得大家會(huì)有心理負(fù)擔(dān),或者擔(dān)心看到真實(shí)口語轉(zhuǎn)化成文字后的雜亂(比如那些 “嗯”“啊” 之類的詞)。但以我的經(jīng)驗(yàn)來說,現(xiàn)在的大語言模型根本不在乎這些。它們能忽略這些,甚至還能過濾掉其中一大部分。
最終,你能得到一種更自然的創(chuàng)意構(gòu)思流程,AI 能快速且全面地捕捉并解讀。我非常看好聽寫,認(rèn)為它會(huì)成為下一代的核心創(chuàng)意技能。從現(xiàn)在就開始練習(xí)吧,因?yàn)槿绻阆裎耶?dāng)初一樣不熟悉,確實(shí)需要花點(diǎn)時(shí)間來適應(yīng)。
深度融入現(xiàn)有編碼工作流程,效果十分強(qiáng)大
5.工作流整合(Cursor IDE)
關(guān)鍵洞察:深度嵌入 AI ,能大幅提升人們現(xiàn)有工作場(chǎng)景的效率。
影響:將代碼編輯器轉(zhuǎn)變?yōu)橛?AI 賦能的創(chuàng)意環(huán)境。
Cursor 把我最初在 Claude 的 Artifacts 中體驗(yàn)到的由 AI 主導(dǎo)的創(chuàng)意工作流程,直接融入了我現(xiàn)有的代碼庫環(huán)境。它的一些功能讓人覺得理所當(dāng)然 —— 那種 “代碼編輯器當(dāng)然就該有這功能” 的感覺(比如它超好用的 “按 Tab 鍵補(bǔ)全” 功能)。
我職業(yè)生涯早期是一名專業(yè)的 UI 開發(fā)者,但在使用 Cursor 之前,我已經(jīng)多年沒有經(jīng)常寫代碼了。重新上手總是很有挑戰(zhàn)性,因?yàn)槲視?huì)卡在新語法或者不熟悉的框架特性上。像 Cursor 這樣的工具就能幫我繞過很多這類阻礙。比如說,當(dāng)你第一次打開一個(gè)現(xiàn)有代碼庫時(shí),可能會(huì)不知所措,因?yàn)槟悴恢烙心男┛捎玫膬?nèi)容,也不知道去哪里找。有了 Cursor,我就可以針對(duì)正在處理的內(nèi)容以及任何我不確定的代碼提出詳細(xì)問題,并快速得到答案。
使用 Cursor 也讓我更深刻地體會(huì)到,讓 AI 直接讀取和寫入文件系統(tǒng)是多么強(qiáng)大。我用 Claude 的體驗(yàn)也很好,但總是需要額外的步驟,才能把 Claude 的輸出結(jié)果導(dǎo)出,再導(dǎo)入到我之后想用的任何平臺(tái)。而像 Cursor 這樣的工具,輸出結(jié)果能直接出現(xiàn)在最終目的地,這讓工作流程緊密得多。
“Grok”按鈕能讓我瞬間了解背景信息
6.隨時(shí)輔助(X 平臺(tái)上的 “Grok” 按鈕 )
“Grok” 按鈕的實(shí)用性著實(shí)讓我吃了一驚。X 平臺(tái)信息流中的內(nèi)容實(shí)在太多,我常常覺得自己缺乏足夠的背景信息,無法完全理解某條推文。而在內(nèi)容層面直接集成 “Grok” AI 按鈕,讓我只需點(diǎn)擊一下,就能實(shí)時(shí)解讀網(wǎng)上撲面而來的信息。無論是一個(gè)梗圖、一篇文章標(biāo)題,還是其他任何內(nèi)容,能召喚 AI 助手幫我理解看到的東西,都非常實(shí)用。
注:X 平臺(tái)原名推特(Twitter) ,由埃隆?馬斯克(Elon Musk)收購后更名。
我認(rèn)為,隨著我們?cè)诰W(wǎng)上遇到的內(nèi)容越來越需要解讀(這是 AI 生成的嗎?誰發(fā)布的?他們有什么偏見?他們想如何影響我?),這種輔助功能會(huì)變得愈發(fā)重要。
這仍是個(gè)新事物,而且和 X 平臺(tái)上的許多東西一樣,其設(shè)計(jì)執(zhí)行還有待提高。但我很快就希望我常用的其他網(wǎng)站也能有這種隨時(shí)可用的 “給我更多背景信息” 按鈕。最終,感覺操作系統(tǒng)級(jí)別的助手(如 Gemini、Siri 等)會(huì)提供這種功能,但 “Grok” 按鈕是個(gè)很好的例子,展示了如果集成得當(dāng),隨時(shí)輔助功能能有多實(shí)用。
DeepSeek 展示了得出回答背后的 “思考” 過程
7.過程透明度(Deepseek)
關(guān)鍵洞察:展示 AI 得出結(jié)論的過程,能增強(qiáng)用戶的信心與理解。
影響:將機(jī)器推理過程可視化,使之更易理解,從而讓 AI 的回答更具人性化。
這份榜單的最新成員是 Deepseek,其 R1 推理模型一經(jīng)發(fā)布便在網(wǎng)上引起轟動(dòng)。雖然它不是市面上首款推理模型,但它做出了一個(gè)關(guān)鍵的設(shè)計(jì)選擇,從根本上改變了許多人的使用體驗(yàn):它展示了模型的 “思考” 過程。
這一舉措吸引了眾人目光,因?yàn)樗尸F(xiàn)了機(jī)器得出答案的過程,而且其 “思考” 中所用的語言,和人們可能會(huì)說或感受到的極為相似。這種透明度有助于讓用戶相信輸出結(jié)果,因?yàn)樗麄兛梢则?yàn)證思考過程是否合理。另一個(gè)附帶好處是,推理過程本身可能蘊(yùn)含有用的想法 —— 比如中途冒出的某個(gè)想法很有趣,值得單獨(dú)深入探究。
這讓我想起上一代網(wǎng)頁應(yīng)用中進(jìn)度條的重要性。如果交互瞬間完成,可能會(huì)讓人感覺突兀。但如果過程緩慢且毫無提示,人們就會(huì)懷疑它到底是在正常運(yùn)行還是出了故障。進(jìn)度條通過讓用戶明白機(jī)器正在工作,起到了緩沖作用。展示 AI 的推理過程感覺與之類似 —— 它強(qiáng)化了模型確實(shí)在運(yùn)行這一事實(shí)。展望未來,我認(rèn)為未必需要一開始就展示模型推理過程,但至少應(yīng)該確保能清晰地獲取這一信息,以便用戶有需要時(shí)能跟進(jìn)了解。
借助 Discord 的用戶界面(UI),Midjourney 得以推遲打造自家界面
8.界面延遲策略(Midjourney)
關(guān)鍵洞察:搞定核心技術(shù)比擁有一個(gè)精美的界面更重要。
影響:證明了優(yōu)先關(guān)注性能如何能讓界面設(shè)計(jì)決策更有的放矢。
設(shè)計(jì)領(lǐng)域的討論大多聚焦于視覺界面,這就使得 Midjourney 的做法愈發(fā)引人關(guān)注。這家公司早期選擇不打造定制化用戶界面(UI),而是借助 Discord,這一決策既有趣又具戰(zhàn)略眼光。盡管 Midjourney 是一款面向視覺創(chuàng)作者的工具,但其核心產(chǎn)品是實(shí)現(xiàn)這些視覺效果的技術(shù)。這是其他一切的引擎。如果這項(xiàng)技術(shù)不夠出色,人們就不會(huì)在意它有沒有網(wǎng)頁界面。
雖然 Midjourney 如今已有網(wǎng)頁 UI,但最初選擇不做定制化 UI,讓他們得以將精力集中在模型的核心性能上,而非界面。從 Discord 起步,通過將產(chǎn)品置于許多非早期用戶根本不會(huì)涉足的環(huán)境(包括我自己),從而控制了產(chǎn)品需求。它還提供了強(qiáng)大的基于社區(qū)的反饋閉環(huán),有助于做出更明智的產(chǎn)品決策。
所以,根據(jù)你正在開發(fā)的 AI 類型,Midjourney 提醒我們,選擇不打造定制化 UI 本身就可以是一個(gè)戰(zhàn)略性的設(shè)計(jì)選擇。
總結(jié)思考
這八項(xiàng)突破可不只是巧妙的用戶界面(UI)設(shè)計(jì)決策,它們是人類與機(jī)器如何協(xié)同工作這一新篇章的開篇之筆。每一項(xiàng)突破都意味著有人敢于嘗試、敢于探索未經(jīng)證實(shí)的領(lǐng)域,并找到了能引起共鳴的模式。
從 ChatGPT 讓 AI 變得更具對(duì)話感,到 Claude 將對(duì)話轉(zhuǎn)化為創(chuàng)作,再到 Deepseek 向我們展示機(jī)器如何思考 —— 我們正見證一種全新創(chuàng)意媒介的飛速演變。甚至 Midjourney 選擇不打造定制化 UI 這一決策,也在提醒我們,以往對(duì)軟件設(shè)計(jì)的認(rèn)知都有待重新解讀。
創(chuàng)新的步伐并未放緩,反而在加速。但這也正是當(dāng)下如此令人興奮的原因:我們不只是旁觀者,更是參與者。如今,每一位使用 AI 的設(shè)計(jì)師、開發(fā)者和創(chuàng)作者,都有機(jī)會(huì)為這種新興的人機(jī)交互語言貢獻(xiàn)力量。
最初的基石已然就位。問題不再僅僅是 “你要用它們構(gòu)建什么?”,而是 “你將發(fā)現(xiàn)哪些新的基石和模式?”
我很想聽聽哪些突破激發(fā)了你的想象,或者你察覺到了哪些正在浮現(xiàn)的模式。你的見解或許就能為這個(gè)故事譜寫新的篇章。
作者:Patrick Morgan 譯者:李澤慧 審核:李澤慧 編輯:魏文強(qiáng)
本文由人人都是產(chǎn)品經(jīng)理作者【TCC翻譯情報(bào)局】,微信公眾號(hào):【TCC翻譯情報(bào)局】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!