機器學習時代的體驗設計(上):對創(chuàng)造人類行為學習系統(tǒng)的設計師和數(shù)據(jù)學家的啟示

許多數(shù)字服務的設計不僅依賴于數(shù)據(jù)操作和信息設計,還依賴于用戶學習系統(tǒng)。
一般來講,數(shù)字服務的體驗遵循預定義的用戶旅程,具有明確的狀態(tài)和動作。一直以來,設計師的工作一直是創(chuàng)建線性工作流,并將其轉(zhuǎn)化為可以理解和不引人注目的體驗。但是這種情況可能會成為過去時。
過去6個月,我一直在BBVA Data&Analytics(D&A)任職一個相當獨特的職位,這是一家卓越的財務數(shù)據(jù)分析中心。我的工作是利用新興的機器學習技術,使用戶體驗設計得到提升平。
除此之外,我的職責是為數(shù)據(jù)科學團隊帶來整體的體驗設計,并使其成為算法解決方案的生命周期(例如預測模型、推薦系統(tǒng))的重要組成部分。同時,我會對設計團隊的體驗設計進行創(chuàng)造性和戰(zhàn)略性的優(yōu)化(例如網(wǎng)上銀行、網(wǎng)上購物、智能決策),引導它們發(fā)展演變?yōu)椤叭斯ぶ悄堋钡奈磥怼?/p>
事實上,我通過促進設計師和數(shù)據(jù)科學團隊之間的交流合作,來達到設計出由數(shù)據(jù)和算法驅(qū)動的理想的和可行的用戶體驗的目的。
我們定義了一種不同的體驗設計,即人類行為學習系統(tǒng)用戶體驗。這是一個新的嘗試,因為:
- 它創(chuàng)造了新的用戶體驗類型。
- 它重新定義了人與機器之間的關系。
- 它要求設計師和數(shù)據(jù)科學家之間緊密合作。
接下來將會具體闡述這些內(nèi)容的含義。
新型用戶體驗
如今,許多數(shù)字服務的設計不僅依賴于數(shù)據(jù)操作和信息設計,還依賴于用戶學習系統(tǒng)。如果深入剖析這些系統(tǒng),我們會發(fā)現(xiàn)行為數(shù)據(jù)(例如人的交互,系統(tǒng)交互)被作為內(nèi)容提供給生成知識的算法。傳播知識的界面則使得體驗更加豐富。理想情況下,這種體驗會尋求明確的用戶操作或后臺關鍵事件數(shù)據(jù)來創(chuàng)建一個反饋循環(huán),該循環(huán)將為算法提供學習材料。
舉個實際的例子。你知道Spotify “發(fā)現(xiàn)每周”是如何工作的嗎?
“發(fā)現(xiàn)每周”是Spotify的自動音樂推薦“數(shù)據(jù)引擎”,每星期專門為每個Spotify用戶量身定制兩小時的定制音樂推薦。
架構(gòu)改編使得Spotify的“發(fā)現(xiàn)每周”的播放列表具有強大吸引力
“發(fā)現(xiàn)每周”的推薦系統(tǒng)利用Spotify用戶創(chuàng)建的數(shù)百萬個播放列表,為公司的專業(yè)播放列表和那些擁有廣大粉絲群的播放列表帶來額外的權(quán)重。該算法試圖強化那些具有相似品味的用戶的聽歌習慣。它有三個主要任務:
- 一方面,Spotify為每個用戶創(chuàng)建了個性化音樂品味的簡介,將其劃分為藝術家和少數(shù)流派;
- 另一方面,Spotify使用上億級的播放列表,根據(jù)播放列表中歌曲的風格特點,去建立具有相似音樂風格的播放列表
- 每周它都會根據(jù)每個用戶的個人口味去創(chuàng)建推薦列表?;旧?,如果一首最喜歡的歌曲與一首未曾聽過的歌曲一起出現(xiàn)在播放列表中,那么它就會推薦那首新歌。
一般來說,“發(fā)現(xiàn)周刊”播放列表會推薦30首歌曲,這個歌曲列表的內(nèi)容已經(jīng)足夠多了,可以較好地去發(fā)現(xiàn)與個人品味相匹配的音樂。這樣做的好處是可以生成數(shù)千個新的播放列表,這些新的播放列表在一周后會反饋到算法中以產(chǎn)生新的推薦。
這種反饋循環(huán)機制通??梢允宫F(xiàn)有的體驗實現(xiàn)個性化、優(yōu)化或自動化的目的。同時,它們還會根據(jù)建議、預測或情景來創(chuàng)造機會去設計新的體驗。在D&A,我首次提出了一套不太全面的設計方法。
以下是其具體步驟:
為探索而設計
如你所見,推薦系統(tǒng)可以幫助發(fā)現(xiàn)已知的未知甚至未知的未知。例如,Spotify通過對用戶聽音樂的行為與數(shù)十萬其他用戶的聽音樂行為之間的匹配來定義個性化體驗,從而幫助發(fā)現(xiàn)音樂。這種體驗至少面臨三個主要的設計挑戰(zhàn)。
首先,推薦系統(tǒng)傾向于創(chuàng)建一個“過濾器”,將建議(如產(chǎn)品、餐廳、新聞項目、人員連接)限制在一個與過往行為緊密聯(lián)系的世界。為了避免這種問題,數(shù)據(jù)學家有時必須調(diào)整一些不太準確的算法,并增加一些隨機性的建議。
其次,讓用戶可以自主選擇推薦的各個部分也是一個很好的設計實踐。例如,亞馬遜允許用戶刪除可能對建議產(chǎn)生不利影響的項目。想象一下,顧客為他人購買禮物,這些禮物不一定是未來個性化推薦的數(shù)據(jù)參考。
最后,像Spotify這樣,依靠主觀推薦的系統(tǒng)可以使用戶對被推薦的內(nèi)容擁有更多的主觀性和多樣性的選擇。這種人為清理數(shù)據(jù)集或減小機器學習算法局限性的方法通常被稱為“人類計算”或“交互式機器學習”或“相關反饋”。
為決策而設計
數(shù)據(jù)和算法也提供了個性化決策的手段。例如在D&A,我們開發(fā)了一套優(yōu)秀的算法為BBVA客戶提供財務建議。
例如,我們根據(jù)賬戶余額的時間演變來劃分儲蓄行為。通過這種技術,我們可以根據(jù)每個客戶節(jié)省資金的能力來設計個性化投資機會。
這種決策性的算法對準確度有更高的要求,因為它們往往依賴于只能提供真實情況的數(shù)據(jù)集。在財務咨詢的案例中,客戶可以在不同銀行操作多個賬戶,從而避免對儲蓄行為的泄漏。目前來看這是一個比較好的設計實踐,因為它可以讓用戶隱晦或明確地提供不良信息。數(shù)據(jù)學家的責任是明確反饋類型,從而豐富他們的模型,而設計師的工作是找到構(gòu)成體驗組成部分的方法。
為不確定性而設計
傳統(tǒng)上講,計算機程序的設計遵循的是二進制的邏輯,即通過將具有明確的、有限集合的、具體的和可預測的狀態(tài)轉(zhuǎn)換成工作流程來實現(xiàn)?。機器學習算法使用一種模糊邏輯來改變這種情況。它們的目的是尋找一組大概率接近樣本行為規(guī)則的模式(參見Patrick Hebron的《為設計者的機器學習》一文中關于此定義的更加具體的介紹)。這種方法包含一定程度的不精確和不可預知的行為。它們經(jīng)常會反饋一些關于已有信息精確度的提示。
例如,預訂平臺Kayak通過分析歷史價格變化來預測價格的演變。它的“預測”算法旨在讓用戶對是否在一個合適的時間購買一張票產(chǎn)生信心(參見Neal Lathia?《在票價背后的機器學習》)。數(shù)據(jù)學家自然傾向于給出算法預測值的精確度:“我們預測這個票價是x”。這個“預測”實際上是一個基于歷史趨勢的結(jié)果呈現(xiàn)。然而,預測與告知并不相同,設計師必須考慮這樣的預測能夠支撐用戶的行為:“買!這個票價可能會增加”?!翱赡堋迸c“價格走勢的預測”是用戶體驗中的“完美銜接”,這個概念是由 Mark Weiser在施樂帕洛阿爾托研究中心工作期間首次提出,然后由?Chalmers and MacColl進一步將其發(fā)展為一個新的概念——seamful design(有縫設計):
“Seamful design故意向用戶展示“接縫”,并利用通常被認為是消極或有問題的特征”。
Seamful design 利用失敗和局限來改善體驗。它通過收集用戶對于不良設計細節(jié)的建議來改善系統(tǒng)。DJ Patil描述了Data Jujitsu中的巧妙設計。
其他類型的機器學習算法運用精確度和召回率來處理接縫。
- 精確度評分體現(xiàn)了提供完全符合需求的結(jié)果的能力。(精確度指的是算法推送的內(nèi)容與用戶喜好的匹配程度)
- 召回率評分體現(xiàn)了提供大量可能的好建議的能力。(召回率指的是算法推送的內(nèi)容與用戶喜好匹配的內(nèi)容的占比)
算法的理想之處在于提供高精確度和高召回率。不幸的是,精確度和召回率往往相互矛盾。在許多數(shù)據(jù)分析系統(tǒng)中,設計決策經(jīng)常需要在精度與召回率之間進行折中選擇。例如,在Spotify 的發(fā)現(xiàn)周刊中,必須根據(jù)推薦系統(tǒng)的性能來決定播放列表的大小。提供30首歌曲推薦的大播放列表可以凸顯Spotify的信心,足夠多的推薦歌曲增加了用戶獲取完美推薦的幾率。
為參與而設計
今天,我們在網(wǎng)上閱讀信息是基于自身行為和其他用戶的行為產(chǎn)生的。算法通常會評估社交和新聞內(nèi)容的相關性。這些算法的目的是通過推送內(nèi)容獲取更高的參與度或通過發(fā)送通知來建立用戶閱讀習慣。顯然這些為我們所采取的行動并不一定是從我們自身利益出發(fā)。
在注意力經(jīng)濟中,設計師和數(shù)據(jù)學家都應該從用戶的焦慮、強迫、恐懼、壓力和其他精神負擔中學習。資料來源:《地球村及其不適》。照片來源:Nicolas?Nova
可以說,我們進入了注意力經(jīng)濟時代,主要的在線服務正在努力吸引人們,盡可能長時間吸引他們的注意力。他們的業(yè)務是讓用戶在其平臺上盡可能長時間的頻繁操作。但是這也帶來了差的體驗,這些體驗經(jīng)常伴隨著諸如懼怕錯過信息(FoMO)或其他困擾情緒,以此來麻痹用戶的參與。
注意力經(jīng)濟的“演員”也使用麻痹用戶的方法,例如根據(jù)使用時長給予獎勵。這與老虎機中使用的機制完全相同。由此產(chǎn)生的體驗會促使服務(賭場)吸引用戶不斷地尋找下一個獎勵。我們的手機已經(jīng)成為通知、警告、消息、轉(zhuǎn)發(fā)、喜歡的“老虎機”,有些用戶每天平均檢查150次,或者更多。今天,設計師可以使用數(shù)據(jù)和算法來挖掘人們?nèi)粘I钪械恼J知漏洞。這種新的能力對機器學習時代的設計原則提出了新要求(參見Aaron Weyenberg?的《優(yōu)良設計的道德規(guī)范:連接時代的倫理原則)。
然而,用機器學習算法設計的體驗并不一定會成為一種“賭場”體驗。
為時間高效利用而設計
設計一個與眾不同的而不是約定俗成的體驗有很多方式。事實上,像銀行這樣的組織有一定的優(yōu)勢:它是一個以數(shù)據(jù)為基礎的行業(yè),且不需要客戶花費大量的時間在他們的服務上。Tristan Harris的“時間高效利用運動”在這個層面上具有重要意義。他提倡使用數(shù)據(jù)緊密相關或完全不相關的體驗類型。這種技術可以保護用戶注意力和尊重人們的時間。twitter的“當你離開時……”是這種做法的一個很有說服力的案例。其它服務則善于提示與其互動的時間。這種體驗不是關注用戶留存量,而是關注交互的相關程度。
為內(nèi)心平和而設計
數(shù)據(jù)學家擅長檢測正常行為和異常情況。在D&A,我們正在努力促進BBVA客戶內(nèi)心平和,這種機制在情況良好的情況下能夠提供一種通用意識,并觸發(fā)更多關于異常情況的詳細反饋。
我們認為目前這一代機器學習給社會帶來了新的力量,同時也增加了創(chuàng)造者的責任。算法存在偏差并且可能是數(shù)據(jù)源固有的特征。因此,尤其需要注意使算法對于人們來說更清楚易懂,并且監(jiān)管者可以對其進行審查,以了解其影響。實際上,這意味著算法產(chǎn)生的內(nèi)容應該保護用戶的興趣,并且應該解釋其評估的結(jié)果和使用的標準。
體驗設計其他相關的方面如下:
- 為公平而設計
- 為溝通而設計
- 為自動化而設計
可能還有更多方面的內(nèi)容,期待更多人去發(fā)掘。
原文鏈接:https://medium.com/@girardin/experience-design-in-the-machine-learning-era-e16c87f4f2e2
本文由@百度UXC翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自PEXELS,基于CC0協(xié)議
系統(tǒng)而深刻