如何運(yùn)行數(shù)據(jù)可視化項(xiàng)目

0 評(píng)論 4188 瀏覽 10 收藏 12 分鐘

編輯導(dǎo)讀:產(chǎn)品每天都會(huì)產(chǎn)生海量的數(shù)據(jù),將這雜亂的數(shù)據(jù)用圖表或者動(dòng)畫(huà)等可視化的方式展現(xiàn)出來(lái),提升可讀性。那么,如何運(yùn)行一個(gè)數(shù)據(jù)可視化項(xiàng)目呢?本文作者從自身工作經(jīng)歷出發(fā),對(duì)此進(jìn)行分析,希望對(duì)你有幫助。

每個(gè)數(shù)據(jù)可視化項(xiàng)目都始于需求,無(wú)論需求來(lái)自問(wèn)題還是決策,每個(gè)項(xiàng)目都有特定的流程。首先,每個(gè)項(xiàng)目都需要數(shù)據(jù)進(jìn)行可視化。在每個(gè)數(shù)據(jù)可視化項(xiàng)目中,都需要考慮許多因素來(lái)最大程度地降低風(fēng)險(xiǎn)并確保項(xiàng)目成功。

本文將解釋其中的許多概念以及可用于特定類型業(yè)務(wù)的一些用例。探索的關(guān)鍵主題之一是風(fēng)險(xiǎn),因?yàn)樵跊Q定使用哪些數(shù)據(jù)以及特定圖表類型如何最好地表征數(shù)據(jù)時(shí),最小化風(fēng)險(xiǎn)是一個(gè)關(guān)鍵因素。除了風(fēng)險(xiǎn)之外,團(tuán)隊(duì)還可能面臨與數(shù)據(jù)無(wú)關(guān)的某些限制。需要考慮團(tuán)隊(duì)中的人員和技能,因?yàn)檫@可能會(huì)限制可視化可以呈現(xiàn)給哪些受眾。

在設(shè)計(jì)數(shù)據(jù)分析項(xiàng)目時(shí),我們常常想知道首先從哪里開(kāi)始?從數(shù)據(jù)收集、清理、探索、分析和可視化,需要做很多工作才能獲得對(duì)業(yè)務(wù)可操作且有利可圖的洞察力。

步驟 1:了解業(yè)務(wù)問(wèn)題

在項(xiàng)目開(kāi)始時(shí),重點(diǎn)是清楚了解工作的整體范圍、業(yè)務(wù)目標(biāo)、利益相關(guān)者正在尋求的信息、他們希望你使用的分析類型以及關(guān)鍵的可交付成果。在開(kāi)始分析之前定義這些元素很重要,因?yàn)樗兄谔峁└玫亩床炝?。此外,一開(kāi)始就搞清楚很重要,因?yàn)樵陧?xiàng)目完成之前可能沒(méi)有另一個(gè)提問(wèn)的機(jī)會(huì)。

步驟 2:了解數(shù)據(jù)集

此階段從初始數(shù)據(jù)收集開(kāi)始,然后進(jìn)行數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)探索等活動(dòng),以發(fā)現(xiàn)對(duì)數(shù)據(jù)的初步見(jiàn)解,或檢測(cè)有趣的子集以形成隱藏信息的假設(shè)。我們可以使用多種工具來(lái)理解數(shù)據(jù)。根據(jù)數(shù)據(jù)集的大小,我們可以使用 Excel 來(lái)管理可管理的數(shù)據(jù)集,或者使用更嚴(yán)格的工具,如 R、Python、Alteryx、Tableau Prep 或 Tableau Desktop 來(lái)探索和準(zhǔn)備數(shù)據(jù)以供進(jìn)一步分析。

要記住的關(guān)鍵事項(xiàng)是確定關(guān)鍵變量以研究數(shù)據(jù)、查找錯(cuò)誤(遺漏的數(shù)據(jù)、邏輯上沒(méi)有意義的數(shù)據(jù)、重復(fù)的行,甚至拼寫(xiě)錯(cuò)誤)或任何需要修改的缺失變量所以我們可以正確地清理數(shù)據(jù)。

重要的是要注意,在企業(yè)/業(yè)務(wù)環(huán)境中工作時(shí),讓對(duì)源系統(tǒng)具有敏銳知識(shí)的人員(例如 DBA)參與進(jìn)來(lái)會(huì)有所幫助,他們可以幫助理解和提取數(shù)據(jù)。

步驟 3:數(shù)據(jù)準(zhǔn)備

一旦組織了數(shù)據(jù)并確定了所有關(guān)鍵變量,我們就可以開(kāi)始清理數(shù)據(jù)集。在這里,我們將處理缺失值(替換為均值、刪除行或替換為最符合邏輯的值)、創(chuàng)建新變量以幫助對(duì)數(shù)據(jù)進(jìn)行分類并刪除重復(fù)項(xiàng)。數(shù)據(jù)準(zhǔn)備任務(wù)可能會(huì)執(zhí)行多次,并且沒(méi)有任何規(guī)定的順序。在此步驟之后,最終數(shù)據(jù)集已準(zhǔn)備好輸入建模工具進(jìn)行進(jìn)一步分析。

從業(yè)務(wù)角度來(lái)看,在整個(gè)數(shù)據(jù)準(zhǔn)備過(guò)程中,需要不斷加深對(duì)數(shù)據(jù)結(jié)構(gòu)、內(nèi)容、關(guān)系和派生規(guī)則的理解。必須驗(yàn)證數(shù)據(jù)是否處于可用狀態(tài),并且可以管理其缺陷,并了解將其轉(zhuǎn)換為用于報(bào)告和可視化的有用數(shù)據(jù)集需要什么。在這種情況下,利用數(shù)據(jù)剖析可以幫助探索企業(yè)源系統(tǒng)中的實(shí)際內(nèi)容和關(guān)系。數(shù)據(jù)分析可以像編寫(xiě)一些 SQL 語(yǔ)句一樣簡(jiǎn)單,也可以像專用工具一樣復(fù)雜。例如,Tableau 的數(shù)據(jù)準(zhǔn)備是用于分析小型項(xiàng)目數(shù)據(jù)的絕佳工具。對(duì)于企業(yè),很多ETL供應(yīng)商提供了多種工具,可以根據(jù)業(yè)務(wù)的需要和預(yù)算進(jìn)行選擇。

步驟 4:建模

在這一步中,我們將使用各種建模技術(shù)來(lái)測(cè)試數(shù)據(jù)并尋找給定目標(biāo)的答案。通常,同一數(shù)據(jù)挖掘問(wèn)題類型有多種技術(shù),對(duì)數(shù)據(jù)形式有一些特定要求。常見(jiàn)模型包括線性回歸、決策樹(shù)和隨機(jī)建模等。

步驟 5:驗(yàn)證

一旦我們完成構(gòu)建模型(或多個(gè)模型)并進(jìn)行最終部署,就必須徹底評(píng)估模型并審查構(gòu)建模型所執(zhí)行的步驟,以確保其正確實(shí)現(xiàn)業(yè)務(wù)目標(biāo)。模型是否正常工作?數(shù)據(jù)是否需要更多清洗?你找到客戶想要回答的結(jié)果了嗎?如果沒(méi)有,可能需要再次執(zhí)行前面的步驟。

在此步驟中,關(guān)鍵是確定問(wèn)題、定義、轉(zhuǎn)換規(guī)則和數(shù)據(jù)質(zhì)量挑戰(zhàn),并將其記錄下來(lái)以備將來(lái)參考。從商業(yè)角度來(lái)看,這樣的文檔對(duì)于未來(lái)的用戶很有用。維護(hù)問(wèn)題列表并驗(yàn)證數(shù)據(jù)驗(yàn)證期間面臨的新問(wèn)題可以顯著提高項(xiàng)目質(zhì)量,并有助于擴(kuò)大未來(lái)改進(jìn)的范圍并定義業(yè)務(wù)的基礎(chǔ)設(shè)施需求。

步驟 6:可視化

模型的創(chuàng)建通常不是項(xiàng)目的結(jié)束。即使模型的目的是增加對(duì)數(shù)據(jù)的了解,也需要以對(duì)客戶有用的方式組織和呈現(xiàn)派生的信息。根據(jù)要求,此步驟可以像生成報(bào)告一樣簡(jiǎn)單,也可以像實(shí)施可重復(fù)的數(shù)據(jù)評(píng)分(例如段分配)或數(shù)據(jù)挖掘過(guò)程一樣復(fù)雜。

在許多情況下,數(shù)據(jù)可視化對(duì)于將你的發(fā)現(xiàn)傳達(dá)給客戶至關(guān)重要。并非所有客戶都精通數(shù)據(jù),而 EasyV、Tableau 等交互式可視化工具對(duì)于向客戶說(shuō)明你的結(jié)論非常有用,能夠用你的數(shù)據(jù)講故事,有助于向客戶解釋你的發(fā)現(xiàn)的價(jià)值。

與任何其他項(xiàng)目一樣,清楚地確定業(yè)務(wù)目標(biāo)很重要。將流程分解為多個(gè)步驟將確保我們?yōu)榭蛻籼峁┳詈玫目山桓冻晒?/p>

第 7 步:文檔

數(shù)據(jù)可視化項(xiàng)目中步驟的一個(gè)重要補(bǔ)充是文檔。與課堂上完成的項(xiàng)目類似,該文檔應(yīng)簡(jiǎn)要描述項(xiàng)目、數(shù)據(jù)來(lái)源、數(shù)據(jù)概況和質(zhì)量、數(shù)據(jù)的局限性或在數(shù)據(jù)使用過(guò)程中出現(xiàn)的情況、引入的關(guān)鍵轉(zhuǎn)換和模型及其影響或有用性,提高可視化質(zhì)量。最后,本文檔還應(yīng)注意在處理數(shù)據(jù)或創(chuàng)建可在未來(lái)解決的特定可視化時(shí)遇到的問(wèn)題。

數(shù)據(jù)可視化項(xiàng)目流程概述:

在啟動(dòng)任何項(xiàng)目之前,最重要的是讓合適的參與者參與進(jìn)來(lái)。這些參與者可以是委托數(shù)據(jù)可視化項(xiàng)目的企業(yè)主或?qū)⒎e極使用數(shù)據(jù)可視化的主要利益相關(guān)者。業(yè)務(wù)代表的參與對(duì)于首先確定項(xiàng)目需求并實(shí)現(xiàn)需求和成功定義的共同點(diǎn)最為重要。參與和協(xié)作極大地增加了由此產(chǎn)生的可視化解決業(yè)務(wù)需求的可能性。同樣,組織的數(shù)據(jù)用戶也應(yīng)該參與其中,尤其是在討論他們負(fù)責(zé)管理的數(shù)據(jù)時(shí)。創(chuàng)建數(shù)據(jù)可視化應(yīng)該是一個(gè)高度迭代和動(dòng)態(tài)的過(guò)程。

從數(shù)據(jù)可視化中尋找洞察力:

可視化能夠發(fā)現(xiàn)模式和洞察力,這些模式和洞察力可能是已知的和顯而易見(jiàn)的,也可能是新的和出乎意料的。人們應(yīng)該尋求可用于講故事的見(jiàn)解,而不僅僅是期望可視化本身來(lái)說(shuō)明一個(gè)故事。洞察力可以代表不同的事物,例如故事的開(kāi)頭或數(shù)據(jù)中的錯(cuò)誤,因此,為了確保從數(shù)據(jù)和可視化中找到洞察力的有效方法,以下步驟很有幫助并且可以重復(fù)。

1.可視化允許對(duì)數(shù)據(jù)集進(jìn)行獨(dú)特的處理,并且可以通過(guò)多種不同的方式完成,例如圖表、表格、地圖和圖形。例如,轉(zhuǎn)發(fā)的信息應(yīng)該提供有助于查看者做出商業(yè)決策的寶貴見(jiàn)解。帳戶規(guī)劃領(lǐng)域的領(lǐng)導(dǎo)者喬恩·斯蒂爾 (Jon Steel) 對(duì)查看和理解數(shù)據(jù)表示以下看法:“在廣告公司的背景下,規(guī)劃人員與其他人一樣查看相同信息并看到不同內(nèi)容的能力是無(wú)價(jià)的。他們需要能夠獲取各種信息,將其隨機(jī)排列,并以新的模式重新排列,直到出現(xiàn)有趣的東西?!绷己玫?strong>數(shù)據(jù)可視化不僅能傳達(dá)可操作的信息,還能幫助您看到其他人可能看不到的東西。

2.分析和解釋所看到的。在此步驟中,問(wèn)自己以下問(wèn)題:我可以在這張圖片中看到什么?是我的預(yù)期嗎?有什么有趣的圖案嗎?這在數(shù)據(jù)上下文中意味著什么?這些問(wèn)題不僅可以幫助你在可視化中找到意義,而且還可以向你表明,盡管可視化看起來(lái)不錯(cuò),但可視化并沒(méi)有告訴你與數(shù)據(jù)相關(guān)的任何內(nèi)容。

3.記錄見(jiàn)解和步驟。這一步的記錄可以在你查看數(shù)據(jù)之前開(kāi)始。通常,我們?cè)陂_(kāi)始使用數(shù)據(jù)集之前對(duì)數(shù)據(jù)集有期望和假設(shè),并且選擇特定數(shù)據(jù)是有原因的。這些想法可以被記錄下來(lái),讓我們能夠識(shí)別我們的先入之見(jiàn),并通過(guò)找到我們預(yù)期的東西來(lái)降低誤讀數(shù)據(jù)的風(fēng)險(xiǎn)。文檔是最關(guān)鍵但也是最容易被跳過(guò)的步驟。文檔提供了創(chuàng)建圖表的上下文,從而消除了查看多組圖表時(shí)可能出現(xiàn)的任何混淆。記錄時(shí)需要注意的一些事項(xiàng)包括: 為什么我創(chuàng)建了這個(gè)圖表?我對(duì)數(shù)據(jù)做了什么來(lái)創(chuàng)建它?這張圖表告訴我什么?

4.轉(zhuǎn)換數(shù)據(jù)集。此步驟允許探索更多模式和發(fā)現(xiàn)。根據(jù)先前步驟形成的見(jiàn)解,可能會(huì)出現(xiàn)更多有關(guān)數(shù)據(jù)或發(fā)現(xiàn)的問(wèn)題,并且可能需要進(jìn)一步檢查或分析。這可以通過(guò)諸如縮放(將數(shù)據(jù)點(diǎn)聚合為單個(gè)組)、過(guò)濾和異常值去除等轉(zhuǎn)換來(lái)完成。

 

本文由 @阿木木 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!