阿里巴巴云上數(shù)據(jù)中臺之道02——中臺建設(shè)過程解析
本文深入探討了數(shù)據(jù)中臺建設(shè)的具體路徑和實施計劃,詳細(xì)闡述了從現(xiàn)狀梳理到項目成果的全過程,引導(dǎo)讀者了解如何高效構(gòu)建企業(yè)級數(shù)據(jù)中臺,希望對你在數(shù)據(jù)管理和戰(zhàn)略規(guī)劃方面有所啟發(fā)。
本篇主要寫建設(shè)數(shù)據(jù)中臺的建設(shè)路徑,具體的項目實施計劃,以及實施過程中的注意點。
整個過程包含:
一、現(xiàn)狀梳理,明確當(dāng)前主要問題
二、勾勒自下而上的解決方案
三、制定項目計劃
四、項目人員規(guī)劃
五、項目成果
一、首先進(jìn)行現(xiàn)狀梳理,明確當(dāng)前主要問題
每一塊業(yè)務(wù)都有對應(yīng)的ETL開發(fā)團(tuán)隊為其提供數(shù)據(jù)支持,每個團(tuán)隊按自己的思路建設(shè)一套數(shù)據(jù)體系。
指標(biāo)定義階段:字段命名不規(guī)范、口徑不統(tǒng)一、算法不一致。
指標(biāo)規(guī)劃階段:數(shù)據(jù)部門疲于對業(yè)務(wù)支持、缺乏全局規(guī)劃,產(chǎn)品化能力不足。
指標(biāo)開發(fā)階段:煙囪式數(shù)據(jù)開發(fā),數(shù)據(jù)重復(fù),不可信。
指標(biāo)維護(hù)階段:復(fù)雜關(guān)系引用導(dǎo)致指標(biāo)下線牽扯面大。
從此可看出,公司業(yè)務(wù)線較為單一的情況下,不需要盲目上中臺服務(wù);數(shù)據(jù)中臺往往建立在解決一定交叉性數(shù)據(jù)問題的基礎(chǔ)上。
二、勾勒自下而上的解決方案
統(tǒng)一數(shù)據(jù)源:統(tǒng)一ODS數(shù)據(jù)基礎(chǔ)層,并有一個團(tuán)隊負(fù)責(zé)和管控,其他團(tuán)隊無權(quán)復(fù)制數(shù)據(jù)基礎(chǔ)層中的數(shù)據(jù)。
進(jìn)行數(shù)據(jù)的統(tǒng)一規(guī)劃:面向業(yè)務(wù)提供服務(wù)前,由數(shù)據(jù)團(tuán)隊負(fù)責(zé)從業(yè)務(wù)中抽象源于業(yè)務(wù)而又不同于業(yè)務(wù)的數(shù)據(jù)域,再主導(dǎo)統(tǒng)一建設(shè)數(shù)據(jù)中間層。
建設(shè)oneservice服務(wù)體系:將openAPI升級為緩解業(yè)務(wù)變化對數(shù)據(jù)模型沖擊的方法論、數(shù)據(jù)產(chǎn)品,提供統(tǒng)一公用服務(wù)的同事,兼容面向個性化應(yīng)用的服務(wù)。
三、繼而制定項目計劃
梳理清楚現(xiàn)狀之后,明確問題所在,明確解決方案,接下來需要做具體的實施。
第一步:確定并堅定項目目標(biāo)
在不影響業(yè)務(wù)發(fā)展的同時,在業(yè)務(wù)上推進(jìn)數(shù)據(jù)價值化,降本提效為基礎(chǔ)目標(biāo),創(chuàng)造業(yè)務(wù)價值。
第二步:確定指導(dǎo)性的方法論
OneData:公共層建設(shè)核心方法論,知道構(gòu)建與管理數(shù)據(jù)。
OneService:7x24h無間斷、無差異服務(wù)
OneEntity:連接孤島數(shù)據(jù),實現(xiàn)數(shù)據(jù)連接后萃取各類標(biāo)簽進(jìn)行用戶畫像。
其中OneEntity體系包含如下:
1)OneEntity統(tǒng)一實體:全域關(guān)系打通設(shè)想ID-mapping
2)GProfile全域標(biāo)簽:四維標(biāo)簽體系探索,包含自然屬性、社會屬性、興趣偏好、行業(yè)消費偏好…
3)GRelation全域關(guān)系:設(shè)想以全域Entity關(guān)系打通為基礎(chǔ)的等關(guān)系圖譜
4)GBehavior全域行為:以全域Entity關(guān)系聚攏形成全域行為中心
第三步:確定三步走的項目執(zhí)行計劃
第一階段:完成全局架構(gòu)
1. 全面接管ODS數(shù)據(jù)基礎(chǔ)層
全面接管ODS數(shù)據(jù)基礎(chǔ)層,是一件十分吃力不討好的事情,事項十分繁瑣。但接管了ODS數(shù)據(jù)基礎(chǔ)層,則是從數(shù)據(jù)源頭上做了一層把關(guān)控制,防止重復(fù)建設(shè)數(shù)據(jù)體系的現(xiàn)象。
建設(shè)離線數(shù)ODS數(shù)據(jù)基礎(chǔ)層和實時ODS數(shù)據(jù)基礎(chǔ)層。
2. 升級OneData體系
將OneData體系升級到OneDataII,比較關(guān)鍵的是制定關(guān)于數(shù)據(jù)規(guī)范定義、數(shù)據(jù)模型設(shè)計、ETL開發(fā)規(guī)范3大環(huán)節(jié)的方法大綱。
3. 完成業(yè)務(wù)數(shù)據(jù)架構(gòu)
從源頭控制住所有數(shù)據(jù),并且也確定了未來如何建設(shè)和管理數(shù)據(jù)的方法論,那接下來如何設(shè)計具有前瞻性、可持續(xù)性、可擴(kuò)展性的直接面向業(yè)務(wù)層的服務(wù)呢?
需要對業(yè)務(wù)數(shù)據(jù)進(jìn)行盤點、分析和認(rèn)知。但是,如果對所有業(yè)務(wù)都同時進(jìn)行盤點,不僅耗時長且難以深入,不具備可行性。
于是,可以按照“二八原則”,先對關(guān)鍵業(yè)務(wù)及其關(guān)鍵數(shù)據(jù)進(jìn)行第一批盤點,并從業(yè)務(wù)視角和技術(shù)視角同時進(jìn)行盤點。
例如,對淘系數(shù)據(jù)的4100多張報表中的2萬多個指標(biāo)盤點,經(jīng)過多輪篩選,最終保留6600多個指標(biāo),即可保障當(dāng)時的業(yè)務(wù)需求,其中1.4萬個指標(biāo),一部分直接下線,一部分在后續(xù)數(shù)據(jù)公共層建成并切換下線。
第二階段:抓關(guān)鍵業(yè)務(wù)的數(shù)據(jù)建設(shè)
在構(gòu)建好ODS層之后,需要進(jìn)一步豐富和完善DWD、DWS、ADS數(shù)據(jù)應(yīng)用層??偣舶?個方向。
1. 離線數(shù)據(jù)公共層建設(shè)(ODS、DWD、DWS)
最開始建設(shè)淘系數(shù)據(jù)基礎(chǔ)層治理項目,接盤ODS層之后,進(jìn)行深度數(shù)據(jù)治理。,降低存儲和計算資源的消耗,提升數(shù)據(jù)監(jiān)控管理力度。
2. 離線數(shù)據(jù)應(yīng)用層建設(shè)(ADS、報表)
一是面向應(yīng)用服務(wù)的數(shù)據(jù)寬表的建設(shè):基于數(shù)據(jù)公共層,向各個業(yè)務(wù)部門提供方便、快捷的數(shù)據(jù)服務(wù)。
二是給領(lǐng)導(dǎo)們提供關(guān)鍵數(shù)據(jù):建設(shè)面向COO領(lǐng)導(dǎo)層的重點關(guān)注的經(jīng)營指標(biāo)。
三是建設(shè)各業(yè)務(wù)線、行業(yè)的數(shù)據(jù)。
3. 數(shù)據(jù)存儲的專項治理
4. 實時數(shù)據(jù)公共層建設(shè)
第三階段:全面鋪開,逐步推進(jìn)各個項目的數(shù)據(jù)建設(shè)
(下一篇文章中進(jìn)行展開)
第四步:明確處理好關(guān)鍵矛盾
第五步:緊盯業(yè)務(wù)并超越業(yè)務(wù)滿意度
一個月內(nèi)完成第一階段的全局架構(gòu)工作,并快速啟動第二階段。第二階段第一期切入關(guān)鍵應(yīng)用,并在2個月內(nèi)完成數(shù)據(jù)公共層初始化;第二階段二期在遷移存量應(yīng)用的同時支持新需求。
把服務(wù)雙十一和雙十二作為階段性業(yè)務(wù)目標(biāo),讓業(yè)務(wù)人員看到實際效果,技術(shù)人員感受到技術(shù)進(jìn)步,數(shù)據(jù)公共層建設(shè)的推進(jìn)就會由難到易,由慢到快。
第六步:業(yè)務(wù)和技術(shù),兩手都要抓,兩手都要硬
數(shù)據(jù)技術(shù)是數(shù)據(jù)公共層建設(shè)的內(nèi)核力量,包含數(shù)據(jù)模型、存儲治理、數(shù)據(jù)質(zhì)量、安全權(quán)限、平臺運維、研發(fā)工具等。
第七步:以產(chǎn)品化思維推進(jìn)項目
將數(shù)據(jù)公共層建設(shè)視為一個需要長期運營的產(chǎn)品。
第八步:關(guān)注預(yù)警和加強(qiáng)風(fēng)險管理
提前進(jìn)行風(fēng)險規(guī)劃,制定保障措施,如:
風(fēng)險描述:數(shù)據(jù)規(guī)范定義和數(shù)據(jù)模型設(shè)計體系化,需要專業(yè)人才和工具保障。
保障措施:
1)制定規(guī)則及工作流,完善onedata體系數(shù)據(jù)規(guī)范定義,同時以工具化保障onedata體系工作流
2)數(shù)據(jù)產(chǎn)品經(jīng)理和數(shù)據(jù)模型師培養(yǎng),輸出多名具有建模思想和建模能力、同時熟悉業(yè)務(wù)的人員
3)公共層可以穩(wěn)定支持業(yè)務(wù)后,定期安排數(shù)據(jù)模型師和ETL研發(fā)人員深入業(yè)務(wù)以更新對源系統(tǒng)和業(yè)務(wù)的認(rèn)知
四、同時需要項目人員規(guī)劃
若是需要最終完美的完成項目計劃,缺乏其他業(yè)務(wù)部門或技術(shù)部門的配合是萬萬不可的,因為在實際的項目進(jìn)程中,需要一個實體團(tuán)隊來負(fù)責(zé)數(shù)據(jù)公共層建設(shè),以及協(xié)同若干個業(yè)務(wù)線的技術(shù)團(tuán)隊作為虛線加入項目組。
在最初建設(shè)時,數(shù)據(jù)團(tuán)隊只有50個人,而要實現(xiàn)如此龐大的計劃,需要更多人員的支持。在建設(shè)前期由兼職的18羅漢進(jìn)行現(xiàn)狀梳理,并完成全局架構(gòu)。
隨著項目的興起,領(lǐng)導(dǎo)團(tuán)隊對項目愈加看重,因而得到了更多人員資源上的支持。
五、最后靜待項目成果
降本:數(shù)據(jù)計算成本和存儲成本降低,以及因重復(fù)建設(shè)而造成的人力成本的降低等。
2015年,批量數(shù)據(jù)計算總時長減少約50%,解約計算成本近億元;批量數(shù)據(jù)下線,解約存儲空間上百PB,節(jié)約存儲成本上億元。
提效:讓各業(yè)務(wù)部門得到了統(tǒng)一、標(biāo)準(zhǔn)的數(shù)據(jù)服務(wù),并且響應(yīng)速度很快,提升了使用數(shù)據(jù)的效率。
業(yè)務(wù)上,數(shù)據(jù)價值化。
如上是阿里數(shù)據(jù)中臺第一階段、第二階段的建設(shè)過程,接下來一篇會繼續(xù)解析第三階段:全面鋪開的數(shù)據(jù)中臺建設(shè)過程。
專欄作家
草帽小子,公眾號:一個數(shù)據(jù)人的自留地,人人都是產(chǎn)品經(jīng)理專欄作家。《大數(shù)據(jù)實踐之路:數(shù)據(jù)中臺+數(shù)據(jù)分析+產(chǎn)品應(yīng)用》書籍作者,專注用戶畫像領(lǐng)域。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!