探尋one piece的埋點(diǎn)之旅:初識(shí)埋點(diǎn),二檔技能開(kāi)啟
本篇文章主要介紹埋點(diǎn)的基本概念、操作流程,目的是能讓大家對(duì)數(shù)據(jù)埋點(diǎn)有個(gè)基本的認(rèn)識(shí)。
一、引言
動(dòng)漫《海賊王》中,曾經(jīng)擁有世界上一切的男人,海賊王哥爾·D·羅杰,在臨行前說(shuō):“想要我的財(cái)寶嗎,去找吧,我把世界上的一切都放在那里了”。全世界的人們都趨之若鶩奔向大海,尋找one piece,大海賊時(shí)代由此開(kāi)啟!17歲的路飛也遵循了與香克斯的約定,出海航行,立志成為海賊王。
而在2012年初,世界經(jīng)濟(jì)論壇發(fā)布的大數(shù)據(jù)和大影響報(bào)告指出,大數(shù)據(jù)已成為黃金和貨幣等經(jīng)濟(jì)資產(chǎn)。在未來(lái),數(shù)據(jù)將成為商業(yè)競(jìng)爭(zhēng)最重要的資源,誰(shuí)能更好的使用了大數(shù)據(jù),誰(shuí)將領(lǐng)導(dǎo)下一代商業(yè)潮流,大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)!
期待你與奇數(shù)/草帽小子做一個(gè)約定,探尋神奇數(shù)據(jù)中的one piece,成為數(shù)據(jù)產(chǎn)品大牛。
二、數(shù)據(jù)生命周期
想要成為數(shù)據(jù)產(chǎn)品大牛,對(duì)數(shù)據(jù)就要了如指掌,那我們先來(lái)認(rèn)識(shí)一下數(shù)據(jù)的人生之路吧。數(shù)據(jù)生命周期包含四個(gè)階段:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘/分析、數(shù)據(jù)應(yīng)用。
從數(shù)據(jù)的產(chǎn)生到最后應(yīng)用,存在著許許多多的知識(shí)與技巧,本文主要介紹數(shù)據(jù)產(chǎn)生的方式之一:數(shù)據(jù)采集中的數(shù)據(jù)埋點(diǎn)。
埋點(diǎn)數(shù)據(jù)作為可以記錄用戶(hù)行為的數(shù)據(jù),在商業(yè)經(jīng)營(yíng)中能幫助企業(yè)快速定位分析用戶(hù)群體,實(shí)現(xiàn)更好的企業(yè)效益,就像是路飛的二檔技能,幫助他在航行過(guò)程中乘風(fēng)破浪。像草帽小子一樣,開(kāi)啟你的二檔技能吧!
(1)數(shù)據(jù)采集:盡可能細(xì)而全的收集初始數(shù)據(jù),便于后期進(jìn)行數(shù)據(jù)分析與應(yīng)用
- 埋點(diǎn)行為數(shù)據(jù):通過(guò)埋點(diǎn)的方式,采集到的一些行為數(shù)據(jù),如瀏覽、點(diǎn)擊、停留時(shí)長(zhǎng)等;
- 業(yè)務(wù)數(shù)據(jù):伴隨著業(yè)務(wù)產(chǎn)生的數(shù)據(jù),核心是生產(chǎn)系統(tǒng)內(nèi)存儲(chǔ)的業(yè)務(wù)表單數(shù)據(jù);
- 日志數(shù)據(jù):一般是web端日志記錄的數(shù)據(jù);
- 外部接入數(shù)據(jù):從第三方獲得的數(shù)據(jù)。
(2)數(shù)據(jù)預(yù)處理:對(duì)一些不符合標(biāo)準(zhǔn)的數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,得到標(biāo)準(zhǔn)數(shù)據(jù)
(3)數(shù)據(jù)挖掘/分析:對(duì)預(yù)處理后的標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,得到數(shù)據(jù)特性或普適規(guī)律
(4)數(shù)據(jù)應(yīng)用:將數(shù)據(jù)特性或規(guī)律應(yīng)用于業(yè)務(wù),賦予數(shù)據(jù)業(yè)務(wù)價(jià)值
三、數(shù)據(jù)埋點(diǎn)
1. 常見(jiàn)問(wèn)題
在了解完埋點(diǎn)在數(shù)據(jù)生命周期里扮演的角色之后,我們開(kāi)始探討埋點(diǎn)的滴滴點(diǎn)點(diǎn)吧。在做埋點(diǎn)的過(guò)程中,大部分人通常會(huì)遇到以下問(wèn)題:
- 不知道埋點(diǎn)的全生命周期是怎樣的,只有片段概念?
- 如何將業(yè)務(wù)需求轉(zhuǎn)換為數(shù)據(jù)需求?
- 埋點(diǎn)文檔怎么寫(xiě)?事件、參數(shù)是什么?
- 埋點(diǎn)管理如何進(jìn)行,管理平臺(tái)如何搭建?
- 埋點(diǎn)數(shù)據(jù)如何進(jìn)行可視化展現(xiàn)?
- 埋點(diǎn)數(shù)據(jù)準(zhǔn)確性如何保障?
下面我們先來(lái)了解一下埋點(diǎn)的基本概念與生命周期,其他的問(wèn)題將在后續(xù)幾期的文章中逐一解答,本文不再詳細(xì)說(shuō)明。
2. 埋點(diǎn)概念
數(shù)據(jù)埋點(diǎn)是數(shù)據(jù)采集的一種重要方式,主要用來(lái)記錄終端用戶(hù)的操作行為,后續(xù)用于進(jìn)一步優(yōu)化產(chǎn)品以及給運(yùn)營(yíng)提供數(shù)據(jù)支撐。
接下來(lái)介紹埋點(diǎn)的三種方式:
(1)全埋點(diǎn)
通過(guò)加載一段定義好的SDK代碼,前端會(huì)自動(dòng)全量采集全部事件并上報(bào)埋點(diǎn)數(shù)據(jù),能夠呈現(xiàn)用戶(hù)行為的每一次點(diǎn)擊、每一次跳轉(zhuǎn)、每一次登錄等全量、實(shí)時(shí)用戶(hù)行為數(shù)據(jù)。
- 優(yōu)勢(shì):簡(jiǎn)單、快捷;開(kāi)發(fā)工作量少;
- 劣勢(shì):數(shù)據(jù)維度單一(如點(diǎn)擊、加載、刷新);數(shù)據(jù)準(zhǔn)確性不高;上傳數(shù)據(jù)多,消耗服務(wù)器資源多;
- 適用場(chǎng)景:運(yùn)營(yíng)階段初期,產(chǎn)品功能相對(duì)簡(jiǎn)單,主要分析活動(dòng)頁(yè)、著陸頁(yè)、關(guān)鍵頁(yè)面設(shè)計(jì)體驗(yàn)。
2010年,百度MP3 團(tuán)隊(duì)做了一個(gè)叫作Click Monkey 的產(chǎn)品,只要頁(yè)面上嵌入SDK,就可以采集頁(yè)面上所有的點(diǎn)擊行為,并可以繪制出用戶(hù)點(diǎn)擊的熱力圖,這種方式對(duì)于一些探索式的調(diào)研還是非常有用的。
到2013 年,國(guó)外一家數(shù)據(jù)分析公司Heap Analytics,將這種方式更近一步,將APP 的用戶(hù)行為盡可能地全面采集,然后通過(guò)界面配置的方式對(duì)關(guān)鍵行為進(jìn)行定義,這樣便完成了所謂的“無(wú)埋點(diǎn)”的數(shù)據(jù)采集。
(2)代碼埋點(diǎn)
純手動(dòng)寫(xiě)代碼,調(diào)用埋點(diǎn)SDK的函數(shù),在需要埋點(diǎn)的業(yè)務(wù)邏輯功能位置調(diào)用接口上報(bào)埋點(diǎn)數(shù)據(jù),讓使用者可以方便地設(shè)置自定義屬性、自定義事件。
- 優(yōu)勢(shì):按需采集、對(duì)數(shù)據(jù)分析更精細(xì)化,數(shù)據(jù)采集能力較強(qiáng),包含服務(wù)器、數(shù)據(jù)庫(kù)、第三方數(shù)據(jù);
- 劣勢(shì):項(xiàng)目工程量大,開(kāi)發(fā)成本及溝通成本高;
- 適用場(chǎng)景:運(yùn)營(yíng)階段中后期,追求精細(xì)化運(yùn)營(yíng),需要進(jìn)行多維數(shù)據(jù)分析。
在Google Analytics 年代,就已出現(xiàn)代碼埋點(diǎn)。目前,國(guó)內(nèi)的主要第三方數(shù)據(jù)分析服務(wù)商,如百度統(tǒng)計(jì)、友盟、TalkingData等都提供了這一方案。
(3)可視化埋點(diǎn)
產(chǎn)品及運(yùn)營(yíng)可在可視化界面上圈選定義事件,來(lái)追蹤用戶(hù)行為,相比于手動(dòng)埋點(diǎn)更新困難,埋點(diǎn)成本高的問(wèn)題,可視化埋點(diǎn)優(yōu)化了移動(dòng)運(yùn)營(yíng)中數(shù)據(jù)采集的流程,能夠支持產(chǎn)品運(yùn)營(yíng)隨時(shí)調(diào)整埋點(diǎn),無(wú)需再走發(fā)版流程,直接把配置結(jié)果推入到前端,數(shù)據(jù)采集流程更簡(jiǎn)化,也更方便產(chǎn)品的迭代。
- 優(yōu)勢(shì):開(kāi)發(fā)工作量少,使用成本低;
- 劣勢(shì):數(shù)據(jù)精準(zhǔn)度不高、針對(duì)頁(yè)面上點(diǎn)擊可見(jiàn)元素、數(shù)據(jù)維度單一(如點(diǎn)擊);
- 適用場(chǎng)景:運(yùn)營(yíng)階段初期,頁(yè)面簡(jiǎn)單,主要分析點(diǎn)擊事件。
國(guó)外比較早做可視化的是Mixpanel,國(guó)內(nèi)較早支持可視化埋點(diǎn)的有TalkingData、諸葛IO,2017年騰訊的MTA也宣布支持可視化埋點(diǎn)。
3. 埋點(diǎn)生命周期
如同數(shù)據(jù)的產(chǎn)生與應(yīng)用存在一個(gè)生命周期,埋點(diǎn)從需求提出到質(zhì)量管理,也有一個(gè)完整的生命周期:
埋點(diǎn)的生命周期主要分為以下三個(gè)階段:
(1)需求階段:進(jìn)行需求采集和需求分析,保證埋點(diǎn)滿足核心業(yè)務(wù)需求
- 數(shù)據(jù)需求池:對(duì)數(shù)據(jù)需求進(jìn)行整體維護(hù),記錄需求業(yè)務(wù)場(chǎng)景、需求內(nèi)容、提出者、時(shí)間等
- 產(chǎn)品信息架構(gòu):梳理產(chǎn)品結(jié)構(gòu),熟悉產(chǎn)品
- 用戶(hù)行為路徑:分析用戶(hù)路徑,得到核心業(yè)務(wù)指標(biāo)
(2)設(shè)計(jì)階段:進(jìn)行埋點(diǎn)版本規(guī)劃和埋點(diǎn)設(shè)計(jì)
- 埋點(diǎn)版本規(guī)劃:根據(jù)需求優(yōu)先級(jí),分版本上線,快速迭代;
- 埋點(diǎn)文檔:詳細(xì)描寫(xiě)版本記錄、數(shù)據(jù)流程圖、埋點(diǎn)事件等內(nèi)容;
- 后臺(tái)原型設(shè)計(jì):埋點(diǎn)管理后臺(tái)、數(shù)據(jù)可視化平臺(tái)原型。
(3)質(zhì)量管理階段:保障埋點(diǎn)數(shù)據(jù)的準(zhǔn)確及有效
- 數(shù)據(jù)準(zhǔn)確性驗(yàn)證:埋點(diǎn)數(shù)據(jù)的準(zhǔn)確性需要及時(shí)得到驗(yàn)證,以保證后續(xù)數(shù)據(jù)質(zhì)量;
- 數(shù)據(jù)監(jiān)控:定期監(jiān)控埋點(diǎn)數(shù)據(jù)的產(chǎn)生情況;
- 埋點(diǎn)下線:沒(méi)有價(jià)值、不符合當(dāng)前需求的埋點(diǎn)進(jìn)行下線。
四、總結(jié)
本篇文章主要介紹埋點(diǎn)的基本概念、操作流程,目的是能讓大家對(duì)數(shù)據(jù)埋點(diǎn)有個(gè)基本的認(rèn)識(shí)。埋點(diǎn)學(xué)習(xí)就像路飛打CP9,需要在實(shí)戰(zhàn)去訓(xùn)練,才能在最后戰(zhàn)勝CP9首領(lǐng)路奇。而在這個(gè)實(shí)戰(zhàn)的過(guò)程中,路飛的身價(jià)從一億貝利漲到了三億貝利,相信你也能在學(xué)習(xí)的過(guò)程中,像草帽小子一樣身價(jià)翻番。
作者:草帽小子;公眾號(hào):一個(gè)數(shù)據(jù)人的自留地,wx:luckily304
本文由 @草帽小子 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
不錯(cuò)
有個(gè)疑問(wèn),數(shù)據(jù)的準(zhǔn)確性校驗(yàn)有什么好的方法分享嗎
后續(xù)會(huì)寫(xiě)數(shù)據(jù)質(zhì)量相關(guān)的內(nèi)容,可以在我的公眾號(hào)上看