8億鐵路大數(shù)據(jù)在風(fēng)控、助貸及用戶分層等近20個場景的應(yīng)用解析
根據(jù)相關(guān)專業(yè)機構(gòu)及專業(yè)人員的實際應(yīng)用效果反饋,鐵路數(shù)據(jù)在風(fēng)控策略及助貸業(yè)務(wù)的客群資質(zhì)識別都有非常明顯的效果。本文詳細(xì)解析覆蓋8億人的鐵路數(shù)據(jù),希望可以給到各部門伙伴一定的參考。
目錄:
前言
一、覆蓋8億群體的12306歷史發(fā)展
二、鐵路客運用戶畫像系統(tǒng)
2.1系統(tǒng)總體架構(gòu)設(shè)計
2.2對接系統(tǒng)及數(shù)據(jù)
2.3數(shù)據(jù)處理的類型
2.4鐵路系統(tǒng)主要數(shù)據(jù)源分布
三、基于用戶行為的用戶畫像
鐵路旅客畫像
四、鐵路用戶畫像實現(xiàn)步驟
4.1數(shù)據(jù)源分析
4.2客票特征數(shù)據(jù)
4.3客票原始數(shù)據(jù)
4.4目標(biāo)分析
4.5標(biāo)簽計算
4.6鐵路用戶特征
4.7鐵路用戶出行特性
五、客列車分類【主要關(guān)注GCD列車】
高速動車組列車(G字頭)
城際動車組列車(C字頭)
普通動車組列車(D字頭)
直達特快旅客列車(Z字頭)
特快旅客列車(T字頭)
快速旅客列車(K字頭)
普通旅客快車(普快)
普通旅客列車
臨時旅客列車(L字頭)
旅游列車(Y字頭)
六、指標(biāo)分析邏輯舉例
6.1單個指標(biāo)分析
6.2多指標(biāo)分析
6.3通過旅客周轉(zhuǎn)量及客流量做分析
6.4通過客運量做分析
6.5常住地界定
七、用戶畫像系統(tǒng)鐵路公司對外應(yīng)用場景
7.1核驗服務(wù)
7.2精準(zhǔn)營銷
7.3業(yè)務(wù)預(yù)測
7.4風(fēng)險識別
八、用戶畫像系統(tǒng)的應(yīng)用
8.1征信服務(wù)
8.2用戶核驗系統(tǒng)
九、鐵路數(shù)據(jù)應(yīng)用場景及價值
9.1社會價值
9.2經(jīng)濟價值
十、結(jié)語
前言
在個人金融風(fēng)控場景,常見的數(shù)據(jù)除了基礎(chǔ)核驗外(身份證2要素、銀行卡3/4要素、運營商3要素)外,運營商爬蟲(現(xiàn)禁用)、央行征信(持牌機構(gòu)使用較多、助貸機構(gòu)及金科使用較少)、民間借貸記錄、設(shè)備行為統(tǒng)計形成的用戶畫像等,社保、公積金、電商數(shù)據(jù)由于數(shù)據(jù)的開放性問題,其實使用的不多。
然后由于最近半年的數(shù)據(jù)行業(yè)的緩存及敏感數(shù)據(jù)的外泄或與高利貸合作的不良行為,導(dǎo)致主營運營商爬蟲及民間借貸記錄2類數(shù)據(jù)產(chǎn)品的機構(gòu)被查,相關(guān)產(chǎn)品無法對外,引起了大部分包括銀行在內(nèi)的相關(guān)風(fēng)控策略的大調(diào)整及產(chǎn)品調(diào)整。
很多行業(yè)的伙伴都在愁,有無什么數(shù)據(jù)來源合規(guī)安全且可以在一定程度上替換運營商爬蟲及民間借貸記錄數(shù)據(jù)效果的,航旅及鐵路或者是相對有效的。
根據(jù)相關(guān)專業(yè)機構(gòu)及專業(yè)人員的實際應(yīng)用效果反饋,鐵路數(shù)據(jù)在風(fēng)控策略及助貸業(yè)務(wù)的客群資質(zhì)識別都有非常明顯的效果。
之前已經(jīng)分析過航旅數(shù)據(jù),這次詳細(xì)解析覆蓋8億人的鐵路數(shù)據(jù),希望可以給到各部門伙伴一定的參考。
鐵路數(shù)據(jù)部分字段維度是這樣的:
一、覆蓋8億群體的12306歷史發(fā)展
12306網(wǎng)站于2010年1月30日(2010年春運首日)開通并進行了試運行。用戶在該網(wǎng)站可查詢列車時刻、票價、余票、代售點、正晚點等信息。
2011年06月12日,京津城際鐵路率先試水網(wǎng)絡(luò)售票。
2011年9月30日,所有動車組線路實施網(wǎng)上訂票。
2011年11月20日,Z字頭全部直達特快列車車票實施網(wǎng)上訂票。
2011年12月23日,鐵道部最終兌現(xiàn)在年底前網(wǎng)絡(luò)售票覆蓋所有車次的承諾。
2013年11月20日,12306新增支付寶支付通道。
2013年12月6日,改版后的12306網(wǎng)站上線。
2013年12月8日,12306手機客戶端正式開放下載。
自2015年11月26日鐵路春運售票工作啟動以來,截止12月15日,鐵路部門共發(fā)售火車票1.7億張,其中,通過12306網(wǎng)站發(fā)售車票突破1億張,已占到售票總量60%。自2011年推出網(wǎng)絡(luò)購票以來,12306網(wǎng)站累計發(fā)售火車票35億張。
自2017年7月17日起,乘坐G、D字頭列車的乘客可以通過12306網(wǎng)站或客戶端提前預(yù)訂動車上的飯菜以及站外的食物。同時,如果是通過電話、車站窗口、代售點、自動售票機等其他方式購票,也可登錄12306網(wǎng)站或移動客戶端,從首頁選擇“訂餐服務(wù)”,輸入車次和聯(lián)系人信息后,同樣能進行點餐,可以通過微信和支付寶實現(xiàn)快捷支付。
另外,已經(jīng)訂好的旅客,如果要進行網(wǎng)上退票、改簽、變更到站,系統(tǒng)會自動提醒旅客進行退餐,在實體窗口進行了以上操作的旅客,也可在網(wǎng)上自行辦理退餐。【意味著,鐵路體系的用戶餐飲消費記錄最早可以溯源到2017年7月?!?/strong>
2019年5月,來自中國國家鐵路集團有限公司的統(tǒng)計顯示,系統(tǒng)年售票量已超過31億張,日售票能力達到1500萬張,高峰時每秒售票量達700張,網(wǎng)頁瀏覽量超過1500億次/天?;ヂ?lián)網(wǎng)售票占鐵路售票總量的82.8%,12306已經(jīng)成為世界上規(guī)模最大的實時票務(wù)交易系統(tǒng)。【10000次瀏覽量才有1張票成交,萬分一的成交率。這其中應(yīng)該大多都是搶票軟件帶來的流量。】
中國鐵路客票系統(tǒng)作為全球交易量最大的鐵路票務(wù)系統(tǒng),已服務(wù)8億人群,并有3億12306網(wǎng)站注冊用戶,2億12306客戶端總裝機量。
目前,12306互聯(lián)網(wǎng)售票占比最高超過80%。
鐵路客運快速發(fā)展積累了大量數(shù)據(jù),這些數(shù)據(jù)產(chǎn)生于系統(tǒng)運行、業(yè)務(wù)運營、旅客出行等各個環(huán)節(jié),對它們的整合和分析可為管理部門提供決策支持,為運營部門業(yè)務(wù)開展提供支撐,為旅客用戶提供更個性化、更好的社會化服務(wù)。因此,充分發(fā)掘和利用這些數(shù)據(jù)資產(chǎn),可為鐵路產(chǎn)生巨大的價值。
中國鐵路客票團隊從2012年開始進行大數(shù)據(jù)的應(yīng)用技術(shù)研究,針對數(shù)據(jù)采集、存儲、處理、共享、可視化及數(shù)據(jù)安全等形成技術(shù)積累和人才儲備,對客運業(yè)務(wù)及運營需求進行數(shù)據(jù)歸類、模型建立和經(jīng)驗總結(jié),將技術(shù)與應(yīng)用結(jié)合實踐,搭建小規(guī)模的大數(shù)據(jù)平臺,并在部分業(yè)務(wù)系統(tǒng)中開展試點應(yīng)用。
【鐵道部是在2011年年底前實現(xiàn)網(wǎng)絡(luò)售票覆蓋所有車次,代表鐵路+互聯(lián)網(wǎng)已初步實現(xiàn),互聯(lián)網(wǎng)化過程會產(chǎn)生大量線上數(shù)據(jù),這就需要鐵路部門開始建設(shè)相應(yīng)的數(shù)據(jù)治理平臺及數(shù)據(jù)在內(nèi)部應(yīng)用的嘗試】
二、鐵路客運用戶畫像系統(tǒng)
大眾出行的工具無非就是自行車、摩托車、汽車、客車、鐵路、航空、海運等。鐵路作為人們出行的重要交通工具之一,一開始也只是想著或者只提供單一的快速出行服務(wù)。但互聯(lián)網(wǎng)的高速發(fā)展、給予了鐵路更便捷的購票方式體驗,而高速鐵路班次的開通為注重出行質(zhì)量的群體多了一個選擇,這樣的基礎(chǔ)環(huán)境下,鐵路用戶的數(shù)量增長很快。
但其實還是會持續(xù)面臨競爭對手汽運、空運的競爭,并且互聯(lián)網(wǎng)時代用戶都習(xí)慣了一條龍的服務(wù)。即便是傳統(tǒng)的鐵路服務(wù)也不能不隨之升級轉(zhuǎn)變,逐漸往生態(tài)合作的方向嵌入出行鏈前后的產(chǎn)品服務(wù),提升用戶體驗,提升競爭能力,也為鐵路集團延展了更多的收入入口。
例如站車WIFI運營服務(wù)、互聯(lián)網(wǎng)訂餐、約車、酒店、旅游等延伸服務(wù)系統(tǒng),延伸服務(wù)的開發(fā)為鐵路客運一站式服務(wù)提供了基礎(chǔ)。維護客戶關(guān)系的核心的保障核心服務(wù)質(zhì)量的同時,給與客戶出行鏈條全方位的增值服務(wù)。
與之匹配的,將原本的客運決策系統(tǒng),僅能基于客座率、運行圖、旅客出行規(guī)律等提供決策服務(wù)的,重新升級打造成為增加針對旅客購票行為、出行行為、訂餐行為、站車WIFI上網(wǎng)等數(shù)據(jù)進行深入挖掘的的用戶特征的分析系統(tǒng),滿足不同旅客的個性化產(chǎn)品服務(wù)需求。
鐵路客運用戶畫像系統(tǒng)對內(nèi)不僅能夠為鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)、站車WI-FI運營服務(wù)系統(tǒng)、互聯(lián)網(wǎng)訂餐服務(wù)系統(tǒng)等鐵路各個系統(tǒng)提供旅客群體分析、用戶異常行為發(fā)現(xiàn)、客運產(chǎn)品智能精準(zhǔn)營銷、廣告投放等服務(wù),對外可以為第三方企業(yè)提供數(shù)據(jù)核驗、精準(zhǔn)營銷方案等服務(wù)。
【旅客群體分析及用戶異常行為發(fā)現(xiàn)等,其實都需要相關(guān)場景板塊用戶參與頻次夠多才可以實現(xiàn),單純依靠鐵路體系的沉淀數(shù)據(jù),進展會相對較慢。另外對外服務(wù)的產(chǎn)品能力其實是參考運營商體系搭建的,鐵路數(shù)據(jù)核驗=運營商3要素核驗,鐵路客戶精準(zhǔn)營銷=運營商精準(zhǔn)營銷。從單的客群覆蓋率來說,鐵路是比任一一家運營商的覆蓋都大的,但從頻率和維度來說,鐵路之前的數(shù)據(jù)沉淀肯定還是有待提高的?!?/p>
鐵路客運用戶畫像系統(tǒng)綜合考慮了分布在業(yè)務(wù)系統(tǒng)專網(wǎng)、鐵路服務(wù)內(nèi)網(wǎng)、鐵路服務(wù)外網(wǎng)等網(wǎng)絡(luò)中的相關(guān)服務(wù)系統(tǒng),構(gòu)建了安全可靠的數(shù)據(jù)采集子模塊以及數(shù)據(jù)服務(wù)子模塊,在保證各鐵路客運信息系統(tǒng)正常運行的情況下,能夠進行業(yè)務(wù)數(shù)據(jù)采集存儲,深度挖掘潛在的價值,并將分析結(jié)果運用到各個業(yè)務(wù)系統(tǒng)內(nèi),提高各個信息系統(tǒng)的服務(wù)質(zhì)量。
客運用戶畫像的規(guī)劃起因:
- 一方面,鐵路企業(yè)無法依賴傳統(tǒng)的運輸服務(wù)來分析旅客的特征及分類;
- 另一方面,隨著鐵路的競爭對手(航空、公路等)對旅客用戶標(biāo)簽特征的越來越重視,這種反差會直接導(dǎo)致鐵路高價值旅客的大量流失。因此才有鐵路公司自行打造客運用戶畫像系統(tǒng)的念頭。
2.1系統(tǒng)總體架構(gòu)設(shè)計
鐵路客運用戶畫像系統(tǒng)需要與鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)、客運營銷系統(tǒng)、站車WIFI運營服務(wù)系統(tǒng)、互聯(lián)網(wǎng)訂餐系統(tǒng)等進行數(shù)據(jù)交互,考慮跨網(wǎng)數(shù)據(jù)傳輸、設(shè)備資源分布等情況,鐵路用戶畫像系統(tǒng)主要在鐵路服務(wù)內(nèi)網(wǎng)建設(shè)。
鐵路客運用戶畫像系統(tǒng)按照鐵路服務(wù)內(nèi)外網(wǎng)安全規(guī)范進行建設(shè),利用數(shù)據(jù)及服務(wù)接口通過安全平臺組件實現(xiàn)業(yè)務(wù)系統(tǒng)專網(wǎng)、鐵路服務(wù)內(nèi)網(wǎng)、鐵路服務(wù)外網(wǎng)等部署的相關(guān)系統(tǒng)與鐵路客運用戶畫像系統(tǒng)間的數(shù)據(jù)交換。
2.2?對接系統(tǒng)及數(shù)據(jù)
無論是鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)、客管系統(tǒng)、清算系統(tǒng)、客服系統(tǒng)、財保系統(tǒng)、短信平臺、支付平臺等客運生產(chǎn)和服務(wù)系統(tǒng),還是來自于客運相關(guān)的延伸服務(wù)系統(tǒng)互聯(lián)網(wǎng)訂餐、廣告和站車Wi-Fi運營服務(wù)等系統(tǒng)。由于系統(tǒng)構(gòu)建的時間不同,采用的技術(shù)不同,系統(tǒng)中存儲的數(shù)據(jù)類型和格式也千差萬別,要把這些數(shù)據(jù)都納入到鐵路客運用戶畫像系統(tǒng)中,經(jīng)過加工和整理后才能使用。
2.3?數(shù)據(jù)處理的類型
根據(jù)鐵路信息系統(tǒng)的數(shù)據(jù)特點,主要涉及的數(shù)據(jù)來源包括網(wǎng)站和手機交易終端的業(yè)務(wù)交易數(shù)據(jù)、網(wǎng)站和手機APP的瀏覽行為日志數(shù)據(jù)、線下設(shè)備的傳感器數(shù)據(jù)、安全設(shè)備的圖像視頻數(shù)據(jù)、通信設(shè)備的信令數(shù)據(jù)等。
根據(jù)數(shù)據(jù)的格式分成結(jié)構(gòu)化、半結(jié)構(gòu)化兩大類;根據(jù)數(shù)據(jù)來源的業(yè)務(wù)時效性要求可以分成批量離線運算、準(zhǔn)實時分析運算、實時流式運算、實時數(shù)據(jù)檢索等類別。
2.4 鐵路系統(tǒng)主要數(shù)據(jù)源分布
作為數(shù)據(jù)存儲和處理的基礎(chǔ)平臺,鐵路客運用戶畫像系統(tǒng)需要從多個客運生產(chǎn)、服務(wù)系統(tǒng)以及延伸服務(wù)系統(tǒng)中進行數(shù)據(jù)采集。
(1)鐵路客票發(fā)售和預(yù)定系統(tǒng)
鐵路客票發(fā)售和預(yù)定系統(tǒng)(簡稱“客票系統(tǒng)”)主要包含旅客實名信息、鐵路客票數(shù)據(jù)、訂票存根等。
鐵路客運用戶畫像系統(tǒng)可以從客票系統(tǒng)獲取旅客購票和出行的相關(guān)信息。
(2)鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)
鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)為旅客提供了互聯(lián)網(wǎng)售票渠道,該系統(tǒng)產(chǎn)生了大量的用戶登錄、查詢、購票、支付等日志數(shù)據(jù),以及用戶的基本信息,包括姓名、身份證號、手機號、郵箱等。
鐵路客運用戶畫像系統(tǒng)可以從鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)獲取旅客購票行為方面的信息。
(3)鐵路旅客運輸管理信息系統(tǒng)
鐵路旅客運輸管理信息系統(tǒng)(簡稱“客管系統(tǒng)”)是以客運管理和服務(wù)人員為用戶,集客運乘務(wù)管理、站車交互、旅客服務(wù)于一體的綜合管理信息系統(tǒng),實現(xiàn)了旅客運輸管理和服務(wù)信息的共享。
鐵路客運用戶畫像系統(tǒng)通過接口可以從客管系統(tǒng)獲取客運管理和服務(wù)方面的相關(guān)數(shù)據(jù)。
(4)鐵路旅客運輸清算系統(tǒng)
鐵路旅客運輸清算系統(tǒng)以清算規(guī)則為依據(jù),通過創(chuàng)建清算數(shù)據(jù)庫、構(gòu)建清算模型和規(guī)則庫進行清算處理,為運輸企業(yè)提供收入費用的清算和資金結(jié)算服務(wù),同時利用智能分析和數(shù)據(jù)挖掘技術(shù)為運輸企業(yè)提供輔助決策支持。
鐵路客運用戶畫像系統(tǒng)可以從清算系統(tǒng)獲取費用清算方面的相關(guān)數(shù)據(jù)。
(5)12306客戶服務(wù)系統(tǒng)
12306客戶服務(wù)系統(tǒng)是鐵路服務(wù)客戶的重要窗口,系統(tǒng)采取語音自助、人工在線、網(wǎng)站查詢、客戶信箱等方式,為社會和鐵路客戶提供客貨運輸業(yè)務(wù)和公共信息查詢服務(wù),并受理旅客投訴、咨詢和建議,累計了大量的旅客的反饋數(shù)據(jù)和問題處理方式集。
鐵路客運用戶畫像系統(tǒng)可以從12306客服系統(tǒng)獲取旅客咨詢、反饋、投訴方面的信息。
(6)鐵路財產(chǎn)保險信息系統(tǒng)
鐵路財產(chǎn)保險信息系統(tǒng)是為適應(yīng)鐵路保險業(yè)務(wù)快速發(fā)展的需要,以保險核心業(yè)務(wù)系統(tǒng)、電子商務(wù)系統(tǒng)、財務(wù)系統(tǒng)為重點,利用既有鐵路信息資源,構(gòu)建的保險信息服務(wù)體系,實現(xiàn)了投保、承保、理賠、客戶服務(wù)等保險業(yè)務(wù)全流程的電子化、網(wǎng)絡(luò)化。
鐵路客運用戶畫像系統(tǒng)可以從鐵路財產(chǎn)保險信息系統(tǒng)獲取投保、理賠方面的相關(guān)信息。
【投保理賠方面的數(shù)據(jù),用在意外險營銷場景比較直接,另外可以根據(jù)投保及理賠情況,給與保險機構(gòu)一定的核保風(fēng)控參考作用】
(7)短信平臺
短信平臺與現(xiàn)有交易業(yè)務(wù)系統(tǒng)緊密結(jié)合,提供短信息收發(fā)功能,目前主要包括鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)注冊用戶的注冊通知、購票通知、行程通知等數(shù)據(jù),有助于提升用戶體驗和實現(xiàn)精準(zhǔn)營銷。
鐵路客運用戶畫像系統(tǒng)可以從短信平臺獲取用戶在驗證、訂票等環(huán)節(jié)的一些操作信息。
【短信驗證碼的注冊、溝通及行程通知可以明確用戶的出行前的行為,只不過無是否真實出行的反饋。因此如果只關(guān)注出行前的行為,部分短信運營商的數(shù)據(jù)庫中也可以獲取?!?/p>
(8)支付平臺
電子支付平臺為業(yè)務(wù)系統(tǒng)提供支付功能,支撐客戶進行業(yè)務(wù)辦理,如互聯(lián)網(wǎng)購票、窗口POS購票、辦理貨運業(yè)務(wù)等。
鐵路客運用戶畫像系統(tǒng)可以從電子支付平臺獲取客戶辦理業(yè)務(wù)或者產(chǎn)品銷售過程中支付環(huán)節(jié)的相關(guān)信息。
【為鐵路公司提供支付能力的支付機構(gòu),其實可以通過用戶在鐵路體系的支付行為獲取用戶的出行頻率及次數(shù),在鐵路生態(tài)體系消費情況,從而對外輸出一定的用戶相關(guān)的鐵路標(biāo)簽產(chǎn)品。】
(9)延伸服務(wù)系統(tǒng)
延伸服務(wù)系統(tǒng)酒店預(yù)訂、餐飲服務(wù)、廣告、定制服務(wù)和站車Wi-Fi運營服務(wù)等子系統(tǒng),主要包括用戶的查詢、訂閱、廣告點擊、服務(wù)定制等方面的數(shù)據(jù),鐵路客運用戶畫像系統(tǒng)可以從延伸服務(wù)系統(tǒng)中獲取的相關(guān)數(shù)據(jù)。
【延伸服務(wù)系統(tǒng)的服務(wù),例如酒店預(yù)訂這塊,除非鐵路相關(guān)APP的用戶粘性很強或者有大的優(yōu)惠力度,要不然感覺這個業(yè)務(wù)起量非常難。另外餐飲這塊現(xiàn)在就自身體驗來看,覆蓋率(用戶購買率)其實也一般般,原因是受限于用餐時段限制及餐品及價格影響,后續(xù)這塊如果有優(yōu)化,或者可以有較大的提升。至于廣告等服務(wù)的用戶數(shù)據(jù)適合非常垂直的服務(wù)場景,與營銷推送及風(fēng)控的場景匹配度還是非常有限?!?/p>
(10)外部系統(tǒng)
除上述內(nèi)部系統(tǒng)外,可以通過接口從氣象、航空等外部系統(tǒng)獲取主要航線的架次、起飛時間、票價等,重要地區(qū)的氣象數(shù)據(jù)等。
三、基于用戶行為的用戶畫像
1. 鐵路旅客畫像
鐵路旅客用戶畫像系統(tǒng)是通過對鐵路用戶的行為數(shù)據(jù)、交易數(shù)據(jù)等進行采集、加工和分析,形成用戶精準(zhǔn)畫像數(shù)據(jù),為旅客提供精準(zhǔn)服務(wù)推薦和個性化的客運服務(wù),對內(nèi)提升鐵路客戶服務(wù)能力和行業(yè)核心競爭力,對外支撐精準(zhǔn)廣告投放以及開展數(shù)據(jù)增值服務(wù)。
鐵路旅客用戶畫像系統(tǒng)的建立填補了鐵路信息化的一項空白,通過對鐵路用戶的行為數(shù)據(jù)、交易數(shù)據(jù)等進行采集、加工和分析,形成用戶精準(zhǔn)畫像數(shù)據(jù),支撐精準(zhǔn)廣告投放和精準(zhǔn)服務(wù)推薦,為用戶提供更個性化、更好的社會化服務(wù),有利于鐵路部門提升客戶服務(wù)能力、提高信息資源收益和核心競爭力。
鐵路客運用戶畫像系統(tǒng)實現(xiàn)了標(biāo)簽體系、標(biāo)簽場景、標(biāo)簽生產(chǎn)、標(biāo)簽輸出以及價值分析功能,該系統(tǒng)從用戶、時間、標(biāo)簽三個維度構(gòu)筑鐵路客運用戶標(biāo)簽,能夠整合鐵路客運各個信息系統(tǒng)多觸點、全渠道的用戶數(shù)據(jù),進行多維度分析建模,自動化生成用戶標(biāo)簽,服務(wù)業(yè)務(wù)場景。這些功能滿足了企業(yè)對大數(shù)據(jù)應(yīng)用全面性、深入性、易用性這三方面的需求。
鐵路客運用戶畫像系統(tǒng)的標(biāo)簽主要從統(tǒng)計方法角度,可以分為事實標(biāo)簽、業(yè)務(wù)標(biāo)簽、模型標(biāo)簽、外部標(biāo)簽;從標(biāo)簽業(yè)務(wù)角度,可以分為用戶基礎(chǔ)標(biāo)簽、交易類標(biāo)簽、出行類標(biāo)簽;從時間角度,可以分為近7天標(biāo)簽、近30天標(biāo)簽、近90天標(biāo)簽、近一年標(biāo)簽等。標(biāo)簽結(jié)構(gòu)如圖所示。
四、鐵路用戶畫像實現(xiàn)步驟
構(gòu)建用戶畫像包含以下步驟:
4.1?數(shù)據(jù)源分析
構(gòu)建用戶畫像是對用戶行為數(shù)據(jù)的抽象表示,所以需要的數(shù)據(jù)源包括用戶相關(guān)的所有數(shù)據(jù)。首先針對用戶行為數(shù)據(jù)進行分類,將數(shù)據(jù)分成靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)主要包括人口屬性、社會屬性、賬戶屬性、商業(yè)屬性等;動態(tài)數(shù)據(jù)包括訪問行為、接觸點行為、交易行為等。
【鐵路自身的風(fēng)控系統(tǒng),針對防黃牛、薅羊毛、惡意搶占票的數(shù)據(jù)基本都是以動態(tài)數(shù)據(jù)為主】
以下是鐵路體系比較全的數(shù)據(jù)字段,也是鐵路數(shù)據(jù)現(xiàn)在謹(jǐn)慎對外數(shù)據(jù)產(chǎn)品來源維度。
4.2?客票特征數(shù)據(jù)
購票日期、購票時刻、上車站、下車站、購買席別、購票方式。
4.3?客票原始數(shù)據(jù)
- 始發(fā)日期、車次、運行區(qū)間、列車始發(fā)時間、上車站、下車站、售票時間、售票方式、席別名、上車人數(shù)等;
- 席別名:特等座、一等座、二等座、無座;
- 售票方式:窗口售票、窗口訂票、網(wǎng)上訂票、自動售票、快通卡(京津城際客運專線特有方式);
- 城市節(jié)點信息:城市名稱、行政級別、各年城市人口數(shù)量等級、各年人均GDP、各年人均可支配收入等;
- 路網(wǎng)信息:車站數(shù)據(jù)錄入,包括車站名稱、車站代碼、車站類型、車站等級、車站里程、所屬路局、所屬城市等;
- 列車信息:列車開行車次、始發(fā)終到站、上車站、下車站及區(qū)間運行時間。
4.4?目標(biāo)分析
由于標(biāo)簽和標(biāo)簽規(guī)則需要業(yè)務(wù)專家參與進行制定,所以定義好畫像的目標(biāo)是至關(guān)重要的。通過對目標(biāo)的確定和數(shù)據(jù)的分析,定義出對應(yīng)的用戶標(biāo)簽(興趣、偏好、需求等),最終為用戶打上標(biāo)簽。同時定義出來的標(biāo)簽根據(jù)業(yè)務(wù)的不同,可以分成事實標(biāo)簽、業(yè)務(wù)標(biāo)簽、模型標(biāo)簽、反饋標(biāo)簽等類型。
以下標(biāo)簽維度,其實嚴(yán)格來說,僅靠鐵路體系的數(shù)據(jù)肯定是不能完全挖掘出來,因此鐵路應(yīng)該是有接入了其他的用戶數(shù)據(jù)維度或者其投資支線機構(gòu)有相關(guān)的維度數(shù)據(jù)才能補充完整。
- 反饋標(biāo)簽:有房一族、有車一族、富豪人群、企業(yè)高管、出行達人、價格敏感。
- 模型標(biāo)簽:高消費人群、目的預(yù)測、消費指數(shù)、影響力指數(shù)、價值評分、潛在分析。
- 業(yè)務(wù)標(biāo)簽:旅客定位、活躍度、出行等級、出行規(guī)律、接觸點、出行喜好。
- 事實標(biāo)簽:人口屬性、社會屬性、會員屬性、消費習(xí)慣、出行記錄、出行方式。
4.5?標(biāo)簽計算
(1)標(biāo)簽計算模型參考
根據(jù)標(biāo)簽的特征,鐵路客運用戶畫像系統(tǒng)標(biāo)簽的計算方法可以分為規(guī)則計算、統(tǒng)計分析、歸納總結(jié)等,適于規(guī)則計算的標(biāo)簽有性別、年齡、籍貫等,可以通過身份證號碼識別,統(tǒng)計分析類主要有出行次數(shù)、購票次數(shù)、出行時間分布等,根據(jù)業(yè)務(wù)規(guī)則通過統(tǒng)計計算獲得。歸納總結(jié)類,主要是根據(jù)用戶標(biāo)簽屬性進一步通過數(shù)學(xué)模型歸納總結(jié)用戶屬性,如常駐地等。
(2)基礎(chǔ)標(biāo)簽計算參考
用戶的基礎(chǔ)標(biāo)簽主要包括用戶的證件號、姓名、手機號、籍貫、年齡、性別等,其中證件號、姓名、手機號等都可以根據(jù)用戶的實名制信息或者注冊信息直接獲得。
(3)統(tǒng)計類標(biāo)簽計算參考
主要是根據(jù)旅客交易行為數(shù)據(jù)進行計算,可以獲得旅客的交易頻次、出行偏好、消費水平等特征的數(shù)字化體現(xiàn),為旅客群體分類提供了重要的數(shù)據(jù)基礎(chǔ)。在鐵路客運用戶畫像系統(tǒng)中,用戶的統(tǒng)計類標(biāo)簽主要包括購票次數(shù)、退票次數(shù)、購票金額、出行里程等,這些標(biāo)簽根據(jù)統(tǒng)計周期分為近一年、近9個月、近半年、近3個月、近7天等5大類。
根據(jù)旅客的出行、交易、偏好等信息進行計算,以某旅客為例的統(tǒng)計標(biāo)簽計算如下所示:
- 用戶出行標(biāo)簽:近3月乘車總次數(shù)、近1年乘車總次數(shù)、近1年車費消費總金額、近1年乘車總里程、近1年總旅行時長、近1年乘車總里程。
- 用戶交易標(biāo)簽:近1年訂單總數(shù)量、近1年交易未支付總張數(shù)、近1年作為乘車人退票總次數(shù)、近1年作為乘車人改簽總次數(shù)、近1年車票掛失次數(shù)、近1年改簽數(shù)量、近3月作為乘車人退票總次數(shù)、近3月作為乘車人改簽總次數(shù)。
- 用戶偏好標(biāo)簽:近1年普通席別乘車數(shù)量、近1年高端席別乘車次數(shù)(軟臥、高軟、特等、商務(wù))、近1年互聯(lián)網(wǎng)購票比例、近1年手機購票比例、近1年提前0-24小時購票比例、近1年提前24-48小時購票比例、近1年提前48小時以上購票比例、近1年G等級列車乘車比例、近1年D等級列車乘車比例、近1年C等級列車乘車比例。
特征分析舉例,近一年提前0-24小時購票比例判斷該旅客出行有無計劃及頻率占比、近一年GDC等級列車乘車比例判斷消費水平、近一年手機購票比例判斷手機購票頻次等。故通過對旅客統(tǒng)計類標(biāo)簽的計算結(jié)果進行分析,可以基于某一個特征或者少數(shù)特征組合對旅客進行群體劃分。
基于以上鐵路用戶的基本出行標(biāo)簽數(shù)據(jù),金融風(fēng)控環(huán)節(jié)如何使用? 營銷環(huán)節(jié)如何形成用戶畫像?我們先來看看鐵路用戶數(shù)據(jù)背后的含義。
4.6 鐵路用戶特征
鐵路用戶特征主要包括:性別、年齡、收入水平、職業(yè)特點(個體商人、企業(yè)老板、公職人員、自由職業(yè)),家庭環(huán)境等因素。
(1)年齡與性別
不同年齡與性別出行者,在出行目的與出行次數(shù)上存在差異。年齡介于18-55歲之間的城市居民,其出行目的主要是工作、學(xué)習(xí)、出差、探親、旅游、訪友等等,并且其出行頻率要顯著高于其他年齡段的城市居民。女性頻率顯著低于男性出行頻率。隨著出行者年齡的額變化出行者對出行時間、出行方式、車次的偏愛會呈現(xiàn)一定的差異。
(2)職業(yè)
旅客出行行為的選擇將會在一定程度上受到個人職業(yè)的影響。按照職業(yè)的不同,大致可以將出行者分為自有職業(yè)人員、個體商人出差、政府企事業(yè)單位等部門的公務(wù)員公務(wù)出差,以及中低收入者、學(xué)生出行等幾大類。
比較來看,公務(wù)員在出行過程中喜歡選擇快速、舒適、安全、高效的出行方式,對于價格敏感度較低,自有職業(yè)人員在出行時對價格敏感程度相對較高。學(xué)生群體,因為可以半價乘坐火車的原因,則學(xué)生中絕大部分更傾向于選擇鐵路這一方式出行。
(3)收入
收入高低會直接影響絕大出行者的出行行為。不同收入水平階層的出行者由于其日常生活習(xí)慣的不同,出行行為存在著明顯的不同。收入較高、經(jīng)濟能力較強者,鑒于其對生活質(zhì)量的要求,其在出行中更愿意以高價錢獲得更好的、更舒適的出行環(huán)境。
出行者會在個人經(jīng)濟承受能力與出行需求之間尋找一個相對的平衡點,此外,出行者的出行目的與出行路線的選擇也會直接影響其出行行為。
例如不同的收入水平選擇的交通工具肯定不一樣,同一區(qū)間的收入水平的群體選擇相同的交通工具的不同檔位的服務(wù)肯定有區(qū)別。
(4)樣本年齡及收入結(jié)構(gòu)
這里收集某調(diào)研報告中的調(diào)查樣本年齡分布數(shù)據(jù):
調(diào)查樣本年齡結(jié)構(gòu):
4.7 鐵路用戶出行特性
出行工具、出行距離、出行目的(工作、學(xué)習(xí)、出差、旅游、探親、訪友)、出行費用、出行時間。
(1)出行工具
市內(nèi):步行、自行車、摩托車、小汽車等。
私人交通方式;常規(guī)公交、軌道交通、出租車等公共交通方式。目的:通勤、通學(xué)、休閑娛樂、購物、回程等。
城市群城際間出行:公路、鐵路、水運、航空及城際軌道交通。城市群一般半徑為400KM,公路及鐵路更具競爭優(yōu)勢。目的:公務(wù)、商務(wù)、出差、旅游、探親訪友等。
(2)出行距離
出行距離的長短會直接影響到出行者的出行行為。例如在出行距離較短時,出行者大多會選擇自駕、乘公共汽車等公路方式出行,公路出行方式的多樣性也使得公路交通方式在短距離出行中具有很大的靈活性。
同時公路廣泛覆蓋的特點可以輕松實現(xiàn)門到門的便利旅行,而對于較長距離的出行,鐵路出行則會作為出行者的首要選擇,其主要原因是鐵路出行相對比較經(jīng)濟、安全、快速與高校。
在運行速度與舒適程度的大大提高使得更多的人們在800-1000公里左右的出行時轉(zhuǎn)向選擇鐵路交通,但對于1000公里以上或者更遠(yuǎn)距離的出行,由于鐵路覆蓋范圍的局限性,使得航空運輸占有一定的優(yōu)勢。
(3)出行目的
工作、公務(wù)、經(jīng)商、旅游、出差、訪友、購物、探親等。
不同出行目的的出行者,對交通運輸服務(wù)指標(biāo)的要求也存在明顯的差異。例如:因公務(wù)問題的出行者,對價格的敏感性較小,他們更多的追求出行環(huán)境的舒適、高速與安全。而經(jīng)商出行的出行者,則更加注重到達時刻的準(zhǔn)時性,同樣的訪友、購物與探親等自費出行目的的出行者,會綜合考慮更多的因素,即如何在經(jīng)濟能夠承受的情況下選擇相對快捷及及時的出行方式。
(4)出行費用
出行費用是出行者在整個出行過程中所支付的所有經(jīng)濟開銷的一種綜合評估,也是影響出行者選擇出行方式的主要因素。出行費用分為出發(fā)地的市內(nèi)交通費用、目的地市內(nèi)交通費用以及城際間的交通費用三個部分。
以業(yè)務(wù)出行為主要出行目的的出行者,更傾向于選擇小汽車或者高速鐵路這樣的較舒適與便捷的出行方式,非業(yè)務(wù)出行的則選擇普通鐵路或者告訴大巴的概率大一些,。這可能是因為業(yè)務(wù)出行的費用來源通常為公費,出行者對出行費用不敏感,更加重視旅途上的舒適性與便捷性;非業(yè)務(wù)出行一般為自費,出行者對出行費用較敏感,更加看重各交通方式的經(jīng)濟性。
(5)出行時間
出行時間分三個部分,出發(fā)地市內(nèi)的出行時間、城際間的出行時間和目的地市內(nèi)的出行時間。不僅出行的距離影響總出行時間,而且換乘的方便程度也有所相關(guān)。
五、客列車分類【主要關(guān)注GCD列車】
1. 高速動車組列車(G字頭)
2009年12月26日起,武廣高鐵開行23趟列車,依據(jù)規(guī)定,武廣高鐵開行高速動車組的車次有個新字母打頭,為“G”,寓意為“高速”。目前在設(shè)計時速為300公里或350公里的線路上運行時,最高時速為300公里,鐵路系統(tǒng)標(biāo)準(zhǔn)念法為“高**次”。例如:G字開頭1號車G1001次就是武漢站~廣州南站直達列車。
2. 城際動車組列車(C字頭)
2008年8月1日,京津城際鐵路正式對公眾運行,新啟用車次為C+4位數(shù)字,意為城際列車,目前最高時速是300公里,鐵路系統(tǒng)標(biāo)準(zhǔn)念法為“城**次”。京津城際的車次范圍是C2001~C2282次。例如:武漢城際列車的車次范圍是C5001~C5720。
3. 普通動車組列車(D字頭)
目前,在設(shè)計為每小時300公里或每小時350公里的線路上行駛時,最高速度為每小時250公里。當(dāng)在設(shè)計為250公里/小時或200公里/小時的路線上行駛時,最大速度為200公里/小時。
4. 直達特快旅客列車(Z字頭)
最高速度是每小時160公里,鐵路系統(tǒng)的標(biāo)準(zhǔn)代碼是“直行時間”。其中大多數(shù)是整排軟座,少數(shù)汽車配備硬臥和硬座,只有一些汽車停在終點站所在的火車站和/或鐵路局內(nèi)的大車站。這種火車是空調(diào)火車。
5. 特快旅客列車(T字頭)
最高時速140公里,鐵路系統(tǒng)標(biāo)準(zhǔn)念法為“特**次”??缇痔乜烊讨煌J鞘小⒏笔〖壥泻蜕倭恐饕丶壥械忍卮笳净蛑边_,管內(nèi)特快全程一般只停地級市。此類列車為空調(diào)列車。
6. 快速旅客列車(K字頭)
最高時速120公里,鐵路系統(tǒng)標(biāo)準(zhǔn)念法為“快**次”。全程??康丶壥蓄惖闹写笳荆灿猩倭恐边_的。此類列車95%以上為空調(diào)列車。其中K1-K2000為跨局列車,K7001-K9850為管內(nèi)列車。
7. 普通旅客快車(普快)
范圍是1001-5998,即快速客運列車,??吭诳h級市和大多數(shù)縣級大中型車站,大約有40列這種類型的火車。其中,1001-1998是長途列車跨越3局或更多局的本地列車,2001-2998是跨越2局的列車,4001-5998是短途列車鐵路局內(nèi)的本地列車。
8. 普通旅客列車
簡稱普客,或慢車,正規(guī)的說法中沒有“普慢”。范圍為6001-7598,停靠大部分可以??康恼军c。由于票價低廉,列車基本上“站站?!保苁苎鼐€乘客喜愛。
9. 臨時旅客列車(L字頭)
在客流高峰期間運營的臨時快速客運列車??吭诳h級市和大多數(shù)縣級主要車站,鐵路系統(tǒng)的標(biāo)準(zhǔn)代碼為“臨時”。這種火車通常在春夏季和國慶節(jié)期間行駛??缇峙R時旅客列車通常沒有空調(diào),這也被稱為“農(nóng)民工專列”。
10.?旅游列車(Y字頭)
只有極少數(shù)的旅游列車使用這個數(shù)字,鐵路系統(tǒng)的標(biāo)準(zhǔn)代碼是“旅行時間”。其中Y1-Y498是局間列車,Y501-Y998是管內(nèi)列車。
目前只有北京,天津存在這種列車,運行區(qū)間為北京北站~延慶站/沙城站,天津站/北站~寶坻/薊縣。
- 動車組列車:一等座、二等座、部分列車有商務(wù)座;還有部分夜間運行的動車組列車有軟臥。
- 直達特快列車:以軟臥為主,部分列車掛有硬臥和硬座或高級軟臥;
- 特快列車:硬座、硬臥、軟臥、部分有高級軟臥或軟座;
- 快速列車:硬座、硬臥、軟臥,很少一部分有軟座;
- 臨時旅客列車、普通列車與快速列車基本相同;
- 城際動車組列車:一等座、二等座;
- 高速列車:一等座、二等座、商務(wù)座。
六、指標(biāo)分析邏輯舉例
6.1?單個指標(biāo)分析
頭等艙的多數(shù)有錢人;折扣票據(jù)的多是普通階層且提前有計劃的,或出游的或定時出差的;當(dāng)天往返或隔天往返的基本都是商務(wù)出行;節(jié)假日往返的多是旅游或探親。
6.2?多指標(biāo)分析
年齡+價格:低年齡+折扣票據(jù)屬于正常資質(zhì)用戶層;低年齡+正常票價或頭等艙的不是富二代就是創(chuàng)業(yè)老板;中年+折扣票據(jù)的或是旅游客群或是普通階層;中年+正常票據(jù)屬正常階層;中年+頭等艙偏老板階層(公務(wù)艙結(jié)合分析類似)。
往返地+身份證歸屬地:目的地與身份證歸屬地一致的,一般是回家探親的;出發(fā)地與身份證歸屬地一致的,一般是常駐城市(可結(jié)合出發(fā)地次數(shù)增強判斷)。
出行頻率+目的地:出行頻率高的,目的地基本一樣的,基本是商務(wù)出行,且屬于高端商務(wù)了,業(yè)務(wù)穩(wěn)定的;出行頻率高,但目的地經(jīng)常變換的,大部分是開拓市場的或者是經(jīng)常出游的。
另外,鐵路出行黑名單可用來判斷用戶失信行為,能出現(xiàn)在出行失信名單的用戶,證明在出行過程中有出現(xiàn)嚴(yán)重的不良行為,那保不準(zhǔn)其在真實貸款后,會有不還款或者在催收環(huán)節(jié)惡意辱罵催收人員的行為。
只不過這部分人群數(shù)量過少,出行黑名單是從2018年下旬才逐漸按月公布,每期公布名單一般幾百到上千個失信人度等,當(dāng)信貸公司每天幾萬幾十萬的調(diào)用過程,只為查詢這個幾千個航旅失信名單,實際應(yīng)用價值不大,也會增加中間的查詢耗時,影響用戶體驗。
6.3 通過旅客周轉(zhuǎn)量及客流量做分析
2018年每月份全國鐵路旅客周轉(zhuǎn)量及客流量
2018年全國鐵路客流量為33.75億人次,旅客周轉(zhuǎn)量為14147億人公里,人均運轉(zhuǎn)里程為419公里。
2017年全國鐵路客流量為30.84億人次。
2017年全國鐵路旅客周轉(zhuǎn)量為13457億人公里。
2017年全國鐵路旅客人均運轉(zhuǎn)里程為436公里。
2018年一到十二月份全國鐵路主要指標(biāo)完成情況表:
這個數(shù)據(jù)表可以根據(jù)當(dāng)前建模溯源要求自行補充分析,主要是從月份周期中先定位大部分人群的出行目的、家鄉(xiāng)位置等,非特殊月份進行商務(wù)、出差、通勤的分析會更精確。另外出行人次及公里數(shù)在給政府做人口遷徙流動決策分析時比較有用。
6.4 通過客運量做分析
2018年全國各大鐵路局的客運量排名:
NO.1 上海局(客運量:6.78億人;客票收入:768億元)2018年發(fā)送旅人人數(shù)6.78億人,(2017年6.28億人),同比增長7.8%。客票收入方面,2018年768億元,(2017年703億元),同比增長9.2%。
NO.2 廣州局(客運量:4.7億人;客票收入:579.5億元)2018年發(fā)送旅客人數(shù)4.7億人,(2017年4.134億人),同比增長13.7%。廣州局旅客發(fā)送人數(shù)增長量排第一,增長幅度排第5。客票收入方面,579.5億元,(2017年511億元),同比增長13.4%,增量第一,增幅第六。
NO.3 北京局(客運量:3.2億人;客票收入:456.7億元)2108年發(fā)送旅客3.2億人,(2017年3.07億人),同比增長4.3%;客票收入方面,456.7億元,(2017年430.7億元),同比增長6%。
NO.4 成都局(客運量:2.93億人;客票收入:289.3億元)2018年旅客發(fā)送人數(shù),2.93億人,(2017年2.45億人),同比增長19.4%,增量排名與增幅排名均排第三位??推笔杖敕矫妫?018年收入289.3億元,(2017年222億元),同比增長30.2%,增幅排第三。
NO.5 沈陽局(客運量:2.37億人;客票收入:185.5億元)2018年旅客發(fā)送人數(shù)2.37億人,(2017年2.35億人),同比增長1%;客票收入方面185.5億元,(2017年178.3億元),同比增長4%。
NO.6 南昌局(客運量:2.36億人;客票收入:230億元)2018年旅客發(fā)送人數(shù)2.36億人,(2017年2.22億),同比增長6.4%;客票收入方面,230億元,(2017年210億元),同比增長9.4%。
NO.7 武漢局(客運量:1.84億人;客票收入:212億元)2018年旅客發(fā)送人數(shù)1.84億人,(2017年1.76億人),同比增長4.5%;客票收入方面,212億元,(2017年193.7億元),同比增長9.5%。
NO.8 濟南局(客運量:1.46億人;客票收入:153.8億元)2018年旅客發(fā)送人數(shù)1.46億人,(2017年1.35億人),同比增長7.4%;客票收入方面,153.8億元,(2017年145.4億元),同比增長5.7%。
NO.9 鄭州局(客運量:1.35億人;客票收入:146.7億元)2018年旅客發(fā)送人數(shù)1.35億人,(2017年1.27億人),同比增長6.8%;客票收入方面,146.7億元,(2017年135億元),同比增長8.6%。
NO.10 南寧局(客運量:1.15億人;客票收入:99.4億元)2018年旅客發(fā)送人數(shù)1.15億人,(2017年1.03億人),同比增長12.1%;客票收入方面,99.4億元,(2017年86.6億元),同比增長14.7%。
NO.11 西安局(客運量:1.11億人;客票收入:126億元)2018年旅客發(fā)送人數(shù)1.11億人,(2017年9071.6萬人),同比增長22.6%,增幅全路第一,增量2054.7萬人,增量也排到了第4位;客票收入方面,126億元,(2017年96.4億元),同比增長30.6%,客票收入方面,西安局增幅同樣位居第一。
NO.12 哈爾濱局(客運量:1.1億人;客票收入:82.7億元)2018年旅客發(fā)送人數(shù)1.1億人,(2017年1.12億人),同比增長﹣1.3%,18個鐵路局里面唯一一個負(fù)增長的鐵路局;客票收入方面,82.7億元,(2017年80.7億元),同比增長2.4%。
NO.13 太原局(客運量:7520.7萬人;客票收入:50.4億元)2018年旅客發(fā)送人數(shù)7520.7萬人,(2017年7313萬人),同比增長2.8%;客票收入方面,50.4億元,(2017年45.7億元),同比增長10.2%。
NO.14 蘭州局(客運量:6082.7萬人;客票收入:56.99億元)2018年旅客發(fā)送人數(shù)6082.7萬人,(2017年5006萬人),同比增長21.4%;客票收入方面,56.99億元,(2017年48.74億元),同比增長16.9%。
NO.15 昆明局(客運量:5463.5萬人;客票收入:56.9億元)2018年旅客發(fā)送人數(shù)5463.5萬人,(2017年4759.6萬人),同比增長14.7%;客票收入方面,56.9億元,(2017年43.6億元),同比增長30.5%,客票收入增幅排名第2。
NO.16 烏魯木齊局(客運量:3802.5萬人;客票收入:51.2億元)2018年旅客發(fā)送人數(shù)3802.5萬人,(2017年3557.9萬人),同比增長6.8%;客票收入方面,51.2億元,(2017年46.3億元),同比增長10.7%。
NO.17 呼和浩特局(客運量:3566.6萬人;客票收入:24.7億元)2018年旅客發(fā)送人數(shù)3566.6萬人,(2017年3467萬人),同比增長2.8%;客票收入方面,24.7億元,(2017年24.2億元),同比增長2.3%。
NO.18 青藏鐵路公司(客運量:1636.4萬人;客票收入:21.5億元)2018年旅客發(fā)送人數(shù)1636.4萬人,(2017年1480.3萬人),同比增長10.5%;客票收入方面,21.5億元,(2017年19.9億元),同比增長8.1%。
以上羅列的數(shù)據(jù)目的是找出鐵路出行頻率最高的城市集群,然后結(jié)合城市集群的經(jīng)濟發(fā)展及就業(yè)工資分布,可以交叉獲取群體的資質(zhì)能力。出行頻率不高的城市集群或者是線下金融機構(gòu)可以考慮的布點選擇或者通過其他出行工具數(shù)據(jù)補充軌跡信息,獲取群體資質(zhì)能力。
6.5?常住地界定
根據(jù)聯(lián)合國經(jīng)濟和社會事務(wù)部統(tǒng)計司在《人口和住房普查原則與建議》中的建議,常住地可按照以下標(biāo)準(zhǔn)界定:
- 在最近12個月的大部分時間一直居住的地方,不包括因度假或工作引起的短暫出行;
- 至少在最近12個月一直居住的地方,不包括因度假或工作引起的短暫出行。
旅客出行一般是從常住地出發(fā)經(jīng)過一個或多個目的地后返回常住地,完成一次出行。對于普通旅客,旅客在目的地的停留時間要遠(yuǎn)小于在常住地停留的時間。鐵路出行數(shù)據(jù)可以描述旅客乘坐火車的出行軌跡,通過分析旅客的出行記軌跡、在目的地的停留時間,利用邏輯判斷、概率計算等方法可以判斷旅客每次出行的起點,從而可以利用旅客一年以上的出行數(shù)據(jù)推斷旅客的常住地。
基于出行數(shù)據(jù)識別常駐地:
利用鐵路旅客出行數(shù)據(jù)推斷常住地信息,受出行數(shù)據(jù)質(zhì)量影響,影響因素主要有:
- 出行次數(shù)過少:部分旅客在統(tǒng)計周期內(nèi)的通過鐵路的出行次數(shù)過少,不能形成有效的出行回路,無法在出行起點與出行終點之間確定常住地,這些旅客的常住地不能通過鐵路出行數(shù)據(jù)進行識別。
- 行程不連續(xù):綜合交通背景下,旅客可組合多種交通方式完成出行,導(dǎo)致鐵路出行數(shù)據(jù)在整個行程上是不連續(xù)的,該類型旅客需要結(jié)合其他交通方式的出行數(shù)據(jù)進行判斷。
- 多出行起點:鐵路出行數(shù)據(jù)可能構(gòu)成多個出行回路,旅客出行時可能存在多個不同的出行起點,該情況下可選取比重最大的出行起點作為常住地。
- 目的地最大停留時間:根據(jù)不同的出行目的,旅客在目的地的停留時間一般會有一個時間上限,當(dāng)旅客在目的地的停留時間過長時旅客可能存在多個常住地,該情況有效無法識別旅客常住地。
七、用戶畫像系統(tǒng)鐵路公司對外應(yīng)用場景
鐵路互聯(lián)網(wǎng)售票系統(tǒng)上線以來注冊用戶已經(jīng)超過3.5億,乘車用戶超過8億,每天都產(chǎn)生海量的用戶行為日志數(shù)據(jù)。隨著鐵路12306互聯(lián)網(wǎng)售票系統(tǒng),站車WIFI運營服務(wù)、廣告平臺、互聯(lián)網(wǎng)訂餐等系統(tǒng)數(shù)據(jù)的不斷規(guī)范和收集,數(shù)據(jù)中已經(jīng)囊括了鐵路客運多年的運營數(shù)據(jù),包括對客票產(chǎn)品的清晰描述和定位、對旅客的行為收集可達“可視化”程度、對延伸產(chǎn)品的轉(zhuǎn)化的理解等方面,急需從平臺囊括的萬千數(shù)據(jù)中,借鑒當(dāng)前互聯(lián)網(wǎng)產(chǎn)品的發(fā)展模式,找尋適合鐵路發(fā)展的數(shù)據(jù)增值應(yīng)用,提高鐵路客運的整體效益和服務(wù)水平。
鐵路客運用戶畫像系統(tǒng)實現(xiàn)對全路局交通場景的信息以及延伸服務(wù)產(chǎn)生的數(shù)據(jù)進行交互、匯集、共享,通過數(shù)據(jù)清理和挖掘分析,為各種鐵路客運服務(wù)系統(tǒng)進行資源管理、分析與服務(wù)提供支持。同時,根據(jù)具體的客運業(yè)務(wù)系統(tǒng)的需要,進一步開發(fā)擴展支撐功能。
增值服務(wù)主要針對六個方面:核驗服務(wù)、精準(zhǔn)營銷、業(yè)務(wù)預(yù)測、風(fēng)險識別、征信服務(wù)。它們都是構(gòu)建在精準(zhǔn)刻畫的用戶畫像的基礎(chǔ)之上,其往往存在目標(biāo)人群定位不準(zhǔn)確、輕視用戶行為兩個問題。而我們的目標(biāo)是建立精準(zhǔn)的“用戶畫像”,以來支撐構(gòu)建出準(zhǔn)確的用戶分群和利用機器學(xué)習(xí)算法構(gòu)建的精準(zhǔn)營銷(個性化推薦)系統(tǒng)、預(yù)測系統(tǒng)、風(fēng)險識別系統(tǒng)、征信服務(wù)系統(tǒng)等。
7.1?核驗服務(wù)
2015年年底央行發(fā)布的《非銀行支付機構(gòu)網(wǎng)絡(luò)支付業(yè)務(wù)管理辦法》。這份新的非銀支付管理辦法于2016年7月1日起正式實施。其要求支付機構(gòu)為客戶開立支付賬戶的,應(yīng)當(dāng)對客戶實行實名制管理[45]。
無論從保障消費者權(quán)益、防范非法活動、降低支付風(fēng)險、促進行業(yè)發(fā)展等那個角度來看,第三方支付實名制都是一件利國利民的好事。但在推行和實施的過程中,無論監(jiān)管機構(gòu),還是支付機構(gòu),如能更好的兼顧用戶體驗,才能把好事辦好。畢竟第三方支付行業(yè)勝在高效的支付效率和較低的用戶交易成本,而差的用戶體驗必然增加用戶交易成本甚至降低支付成功率。這無疑不利于仍然處于起步階段的網(wǎng)絡(luò)支付行業(yè)持續(xù)發(fā)展。
忙于響應(yīng)監(jiān)管、卻疏于兼顧用戶體驗,支付寶、微信支付等主流第三方支付平臺近期對于實名驗證流程的大步推進,也讓不少用戶不由叫苦。各第三方支付平臺急切需要簡化用戶核驗流程,在提高用戶體驗的情況下完成用戶的核驗,故需要借助外部系統(tǒng)提供的核驗服務(wù)。
而鐵路為了保障鐵路旅客生命財產(chǎn)安全,維護旅客運輸秩序幾年前就開始實行實名制,旅客通過互聯(lián)網(wǎng)、電話等方式購票時,購票人需要提供真實準(zhǔn)確的乘車人有效身份證件信息;取票時,應(yīng)當(dāng)提供乘車人的有效身份證件原件或者復(fù)印件。
目前鐵路互聯(lián)網(wǎng)售票系統(tǒng)注冊用戶突破3.5億,乘車旅客信息超過7個億,全部旅客信息都是通過實名制核驗的。所有的數(shù)據(jù)都是真實可靠的,所以鐵路客運用戶畫像系統(tǒng)可以對第三方服務(wù)平臺提供身份核驗服務(wù),發(fā)揮鐵路旅客數(shù)據(jù)的價值,降低第三方支付平臺實名制實施的難度。
當(dāng)然鐵路的身份核驗服務(wù)肯定不如公安部的身份核驗服務(wù)覆蓋率、準(zhǔn)確性及時效性,對于一些非涉及資金及敏感信息的場景,鐵路的身份核驗服務(wù)可以使用。
7.2?精準(zhǔn)營銷
對于互聯(lián)網(wǎng)的營銷原本就屬于數(shù)據(jù)驅(qū)動的領(lǐng)域,大數(shù)據(jù)更是提供了一個前所未有的機會,以大數(shù)據(jù)為基礎(chǔ)的智能營銷是行業(yè)發(fā)展的必然趨勢。
近幾年為了滿足旅客現(xiàn)代化、多元化、全行程、綜合性的出行服務(wù)需求,提高鐵路整體形象,按照“統(tǒng)一規(guī)劃、協(xié)同建設(shè)、分級管理、資源共享”的組織原則,建設(shè)鐵路客運延伸服務(wù)系統(tǒng),開展餐飲服務(wù)、酒店預(yù)訂、旅游預(yù)訂、定制服務(wù)、行程信息服務(wù)、站車商業(yè)、體驗店等圍繞旅客出行的業(yè)務(wù)服務(wù)和各業(yè)務(wù)銷售渠道的廣告管理業(yè)務(wù)。
隨著鐵路延伸服務(wù)的不斷完善,鐵路客運互聯(lián)網(wǎng)產(chǎn)品個數(shù)和種類快速增長,信息過載是鐵路客運大數(shù)據(jù)環(huán)境下最嚴(yán)重的問題之一。這種瀏覽大量無關(guān)的信息和產(chǎn)品過程,無疑會使淹沒在信息過載問題中的用戶不斷流失。
推薦系統(tǒng)作為有效緩解該問題的方法,受到工業(yè)界和學(xué)術(shù)界越來越多的關(guān)注。如何充分利用豐富的用戶反饋、社會化網(wǎng)絡(luò)等信息進一步提高推薦系統(tǒng)的性能和用戶滿意度,成為大數(shù)據(jù)環(huán)境下推薦系統(tǒng)的主要任務(wù)。用戶需要花費大量的時間才能找到自己想買的產(chǎn)品。
根據(jù)旅客的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。為了解決這些問題,鐵路客運用戶畫像系統(tǒng)需要構(gòu)建個性化推薦系統(tǒng)。
該系統(tǒng)是建立在海量用戶畫像系統(tǒng)的應(yīng)用數(shù)據(jù)挖掘基礎(chǔ)上,進行準(zhǔn)確定位產(chǎn)品與用戶關(guān)系的智能服務(wù)系統(tǒng),常見的算法有:協(xié)同過濾、基于內(nèi)容的推薦、基于人口統(tǒng)計學(xué)的推薦,為了兼顧各個算法的優(yōu)點,采用混合推薦算法,為鐵路延伸服務(wù)系統(tǒng)傳入不同推薦算法的推薦的產(chǎn)品列表,以幫助鐵路延伸服務(wù)為其用戶購買產(chǎn)品提供完全個性化的決策支持和信息服務(wù)。
7.3?業(yè)務(wù)預(yù)測
(1)旅客流量預(yù)測
鐵路以其運量大、速度快、低效能、污染少、安全可靠等不可替代的優(yōu)勢,逐漸成為了城市間公共客運系統(tǒng)的骨干架構(gòu)。然而,單一地考慮某一條線路的走向、站點位置,而未從全局整體規(guī)劃考慮,就不可避免的造成資源的浪費。
鐵路客運為了保持市場競爭力,實現(xiàn)利潤最大化,需要了解日常鐵路客運流量、淡旺季變動指數(shù)、冷熱門線路。其中,為了準(zhǔn)確把握市場,需要對客流進行充分的了解和預(yù)測。
(2)餐飲服務(wù)預(yù)測大數(shù)據(jù)應(yīng)用顯現(xiàn)出巨大的經(jīng)濟價值。
正是由于餐飲行業(yè)競爭激烈而又利潤微薄,要想成功實屬不易,不少餐館開始轉(zhuǎn)向大數(shù)據(jù)以獲得競爭優(yōu)勢。而對于餐飲業(yè),大數(shù)據(jù)的關(guān)鍵在于數(shù)據(jù)分析的能力,有效的數(shù)據(jù)分析能力才可能產(chǎn)生高質(zhì)量的結(jié)果。良好的數(shù)據(jù)資產(chǎn)將成為未來核心競爭力,一切皆可被數(shù)據(jù)化,鐵路客運系統(tǒng)目前服務(wù)的用戶量已超過7億,每天會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)的積累,有助于企業(yè)進行預(yù)測和決策。
基于鐵路客運用戶畫像系統(tǒng)收集的用戶行為數(shù)據(jù),通過深入分析,用戶的基本信息、消費頻次、點菜口味、消費水平等都會被發(fā)現(xiàn),并將其進行提煉,分析有助于企業(yè)進行預(yù)測和決策,并將其運用到餐飲行業(yè)“進、銷、存、管理運營”等四個重要節(jié)點。
(3)酒店服務(wù)預(yù)測
市場預(yù)測是酒店開展收益管理工作的基礎(chǔ),其主要作用是為酒店收益管理人員獲取市場信息、掌握未來市場的需求變化情況,分析顧客的消費行為、實施客房預(yù)訂與存量控制,價格決策以及確定超訂量等提供必需的數(shù)據(jù)。同時,也為酒店管理者制定市場戰(zhàn)略和進行市場決策提供重要的參考依據(jù)。
(4)旅游服務(wù)預(yù)測
旅游行業(yè)是大數(shù)據(jù)應(yīng)用前景最廣闊的行業(yè)之一,對用戶的行為分析,可以準(zhǔn)確預(yù)知客流趨向,進而采取相應(yīng)的措施疏導(dǎo)客流??梢灾烙慰拖矚g什么樣的產(chǎn)品,進而開發(fā)建設(shè)適銷對路的產(chǎn)品;還可以知道游客需要什么樣的公共服務(wù),進而改進旅游公共服務(wù)。
通過鐵路客運的海量用戶行為數(shù)據(jù),進行數(shù)據(jù)挖掘,可以準(zhǔn)確的分析出旅游的客源市場在哪里、哪些產(chǎn)品是消費者關(guān)注的,這就為精準(zhǔn)營銷提供了重要的數(shù)據(jù)支撐。
7.4?風(fēng)險識別
(1)異常購票用戶識別
為了識別異常用戶主要使用兩種方案:用戶與客票系統(tǒng)交互日志;用戶常用聯(lián)系人之間的關(guān)系網(wǎng)絡(luò)。
用戶行為日志作為鐵路互聯(lián)網(wǎng)售票系統(tǒng)提供服務(wù)過程中,用戶與系統(tǒng)交互過程中產(chǎn)生的有關(guān)用戶訪問行為的數(shù)據(jù),日志數(shù)據(jù)詳細(xì)描述用戶對互聯(lián)網(wǎng)售票系統(tǒng)的使用情況,通過對海量的購票日志數(shù)據(jù)進行數(shù)據(jù)分析,挖掘并提取出用戶異常購票行為特征,建立規(guī)則庫,根據(jù)規(guī)則識別出異常購票行為。
基于用戶的常用聯(lián)系人構(gòu)建關(guān)系網(wǎng)絡(luò),識別出異常用戶的子拓?fù)鋱D,根據(jù)識別出的子拓?fù)鋱D在全量用戶及常用聯(lián)系人的關(guān)系網(wǎng)絡(luò)中進行相似度計算,識別出危險性較高的用戶。
通過離線分析識別出異常購票行為和異常購票用戶的識別模型,當(dāng)用戶在鐵路互聯(lián)網(wǎng)售票系統(tǒng)購票過程中,實時的收集該用戶的行為日志數(shù)據(jù)以及基本數(shù)據(jù)(個人信息、常用聯(lián)系人信息等),并與離線分析出的識別模型進行匹配,從而達到實時的管控和打擊黃牛黨刷票等行為的目的,維護了互聯(lián)網(wǎng)售票交易的公平性。
(2)羊毛黨識別
羊毛黨以多種形式存在于網(wǎng)絡(luò)里。虛擬多臺電腦設(shè)備并使用IP欺騙的方式,用軟件同時控制多臺智能終端做為肉機,在社區(qū)軟件里組成關(guān)聯(lián)群、招聘“兼職人員”等等,專業(yè)的羊毛黨可以用極低的成本獲取極高的收入,致使許多電商、O2O平臺損失慘重,甚至被搞垮。
運用技術(shù)手段,在注冊環(huán)節(jié)減少惡意軟件的入侵;提高領(lǐng)取門檻;完善用戶的信息審核,邀請用戶填寫仔細(xì)的個人資料,鎖定IP,設(shè)定最大閾值的注冊量,通過相關(guān)歷史數(shù)據(jù),對已注冊用戶進行比對,通過規(guī)則對其進行識別等。
八、用戶畫像系統(tǒng)的應(yīng)用
8.1?征信服務(wù)
大數(shù)據(jù)的發(fā)展對征信發(fā)展起到了非常大的促進作用,征信最早起源于消費分期,沒有定量的描述。進入大數(shù)據(jù)時代,用戶的行為數(shù)據(jù)得到了沉淀和積累,可以使用機器學(xué)習(xí)和數(shù)據(jù)統(tǒng)計的模型來計算和評估用戶的信用,從而促進社會誠信建設(shè)的快速發(fā)展。
通過鐵路客運用戶畫像系統(tǒng)建設(shè)和機制安排,將旅客的購票、訂餐、酒店預(yù)訂、旅游出行、廣告點擊等信息記錄下來,使之規(guī)范化、數(shù)字化、公開化,變無規(guī)律為有規(guī)律,變不可考為有證查,變不可知為能可知。
大數(shù)據(jù)征信面對的是鐵路客運所有的旅客行為數(shù)據(jù)以及上千個維度的評價指標(biāo)。為了對鐵路客運浩繁復(fù)雜的數(shù)據(jù)進行實時、自動的挖掘和計算,鐵路客運用戶畫像系統(tǒng)借助互聯(lián)網(wǎng)、大數(shù)據(jù)、云平臺等新技術(shù),需要創(chuàng)建一套以全路數(shù)據(jù)挖掘、旅客信用計算、對外服務(wù)三大核心技術(shù)為支撐的大數(shù)據(jù)征信模式,實現(xiàn)了旅客行為數(shù)據(jù)采集,行為信用計算的一體化和全自動化。不僅能夠為鐵路客運提供服務(wù),也可以跟其他企業(yè)進行信用業(yè)務(wù)共享。
在金融風(fēng)控及用戶分層場景,部分金融公司在建模過程也獲得不錯的反饋。特別一些P2P業(yè)務(wù)客群通過鐵路的標(biāo)簽識別出相對優(yōu)質(zhì)的小部分客群,然后對這部分客群往銀行等優(yōu)質(zhì)金融場景導(dǎo),其實也是在助貸業(yè)務(wù)做鋪墊。
8.2?用戶核驗系統(tǒng)
用戶核驗系統(tǒng)主要是根據(jù)鐵路客運用戶畫像系統(tǒng)計算出的用戶標(biāo)簽為第三方提供用戶身份核驗服務(wù),發(fā)揮鐵路旅客數(shù)據(jù)的價值,降低第三方支付平臺實名制實施的難度
設(shè)計用戶信用值計算模型。目前第三方軟件以“預(yù)付可提高排名”,“專享100M提速光纖”……為“噱頭”,吸引了大量的用戶借助其進行購票,嚴(yán)重的影響了公平公正的購票環(huán)境,為了打擊非正常購票用戶,上線了風(fēng)控系統(tǒng)。
然而目前風(fēng)控系統(tǒng)只是根據(jù)用戶登錄IP更換頻率、設(shè)備指紋更換頻率、余票查詢頻率、CDN地址更換頻率等角度實時的識別異常請求。海量的歷史數(shù)據(jù)還沒有進行更深一層的分析,還不能有效的挖掘出歷史數(shù)據(jù)的潛在的價值,后期可以根據(jù)用戶畫像系統(tǒng)提供的用戶的行為特征數(shù)據(jù),設(shè)計用戶購票信用值模型,預(yù)測用戶惡意購票的指數(shù),并對接風(fēng)控系統(tǒng)實現(xiàn)異常用戶識別的模型,同時從離線和實時兩個方面更加高效的識別異常用戶。
九、鐵路數(shù)據(jù)應(yīng)用場景及價值
以下圍繞鐵路數(shù)據(jù)在社會及經(jīng)濟2個維度,簡單羅列相應(yīng)的應(yīng)用場景供參考。
9.1 社會價值
(1)為政府部門提供宏觀經(jīng)濟分析報告
鐵路客流大數(shù)據(jù)及貨運大數(shù)據(jù)均體現(xiàn)覆蓋區(qū)域的人口流動及經(jīng)濟變動情況,形成全國或區(qū)域化的宏觀經(jīng)濟分析報告,可為政府部門提供全國及區(qū)域經(jīng)濟變動情況,輔助政府部門實施更精確的宏觀經(jīng)濟調(diào)控策略及手段。
(2)與執(zhí)法部門實現(xiàn)聯(lián)防聯(lián)控
鐵路大數(shù)據(jù)已覆蓋全國超過8億的人口,是人民群眾出行的主要交通工具,因此鐵路部門可以與執(zhí)法部門聯(lián)通,聯(lián)防聯(lián)控,及時發(fā)現(xiàn)犯罪分子的蹤跡,實現(xiàn)快速精確打擊抓捕犯罪分子的目的,保障鐵路出行安全及社會穩(wěn)定。
(3)助力智慧城市的發(fā)展
通過對鐵路大數(shù)據(jù)的挖掘分析及提取,通過XXX打通各部委數(shù)據(jù),打造適合智慧城市需求的數(shù)據(jù)產(chǎn)品,助力智慧城市的發(fā)展,實現(xiàn)對城市的精細(xì)化和智能化管理,從而減少資源消耗,降低環(huán)境污染,解決交通擁堵,消除安全隱患,最終實現(xiàn)城市的可持續(xù)發(fā)展。
(4)打造包括鐵路、高速、國道及海事等全面的交通運輸信用體系
通過整合共享公路建設(shè)、水運工程建設(shè)、道路運輸、水路運輸、安全生產(chǎn)、海事執(zhí)法,以及鐵路、民航、郵政等領(lǐng)域的信用信息,與全國信用信息共享平臺、國家企業(yè)信用信息公示系統(tǒng)等國家級平臺進行對接共享。推動獎懲信息在行政許可、招標(biāo)投標(biāo)等業(yè)務(wù)系統(tǒng)中的應(yīng)用,加快構(gòu)建“守信者無事不擾,失信者利劍高懸”的獎懲格局。
(5)打造鐵路智慧供應(yīng)鏈,支撐實現(xiàn)貨運跨界收益
鐵路智慧供應(yīng)鏈利用鐵路物流平臺,實現(xiàn)上下游供應(yīng)鏈及并行的商貿(mào)或生產(chǎn)供應(yīng)鏈間的資源配置優(yōu)化,促進物流服務(wù)產(chǎn)業(yè)鏈直接相關(guān)的商貿(mào)及供應(yīng)鏈金融服務(wù)體系融合,并將通過“運貿(mào)融一體化”來獲取跨界收益。
(6)為優(yōu)化交通接駁設(shè)施提供決策支持
不同區(qū)域、不同季節(jié)、不同時間的鐵路客運量是不一樣的,針對鐵路客運數(shù)據(jù)的統(tǒng)計分析,為各站點所在城市的交通部門提供交通接駁設(shè)施安排及規(guī)劃,為乘客帶來從鐵路出口直達城區(qū)中心或各景點區(qū)域地帶的無縫鏈接交通乘坐體驗。
(7)為打造旅游景點選址提供鐵路熱力數(shù)據(jù)支持
政府或投資機構(gòu)可以選擇全國鐵路乘客熱力數(shù)據(jù),從人口集中游玩的區(qū)域中挖掘適合打造新的旅游景點的數(shù)據(jù)支撐,或者為擴充景點區(qū)域提供可靠游客流量數(shù)據(jù)支撐。
(8)為政府實現(xiàn)流動人口監(jiān)測提供人口流動數(shù)據(jù)做參考
外來人口大部分都是通過鐵路運輸實現(xiàn)的,特別是長距離遷徙。而外來人口是各個城市都需要重點關(guān)注的,不管是短期游玩還是長期居住。因此鐵路的客流數(shù)據(jù)可以提前告知各個城市監(jiān)管部門,提前做好外來人口的流動監(jiān)控。
(9)為物流園區(qū)科學(xué)布點規(guī)劃提供運力數(shù)據(jù)參考
鐵路歷年貨運數(shù)據(jù)可以支撐貨運起始地、中轉(zhuǎn)地及目的地三地的物流園區(qū)選擇,實現(xiàn)鐵轉(zhuǎn)路或路轉(zhuǎn)鐵的運力調(diào)配最優(yōu),降低運輸鏈條上各企業(yè)的物流運輸成本,提高裝卸貨及運輸?shù)男省?/p>
(10)為物流公司提供鐵路運輸信用體系的不良運輸企業(yè)名單,降低合作風(fēng)險
鐵路運輸體系中涉及的關(guān)聯(lián)運輸企業(yè)數(shù)量眾多,這個合作過程中產(chǎn)生的不良運輸企業(yè)名單,可以為各物流公司在選擇合作伙伴時及時發(fā)現(xiàn)潛在風(fēng)險,降低合作后的損失。
(11)為商業(yè)車險保費定價提供相關(guān)決策支持
商車保費定價中行駛里程、約定行駛區(qū)域、車型、投保車輛數(shù)、絕對免賠額等都會影響其定價,與鐵路貨運長期合作的車輛行駛區(qū)域相對穩(wěn)定,里程也比較清晰,有利于車險公司實現(xiàn)更精確的車險保費定價。
9.2 經(jīng)濟價值
(1)為保險機構(gòu)提供經(jīng)營決策支持
保險機構(gòu)根據(jù)存量客群在保險機構(gòu)及鐵路場景的活躍度,根據(jù)年齡、性別、艙位等級、頻次及出發(fā)到達地點等維度,打造不同保費、保額及保期的出行意外險甚至健康險或壽險等,實現(xiàn)千人千面千險的產(chǎn)品創(chuàng)新,滿足不同保險客群的實際保障需求。
根據(jù)中國銀保監(jiān)會發(fā)布的2018年保險數(shù)據(jù)統(tǒng)計報告顯示,2018年保險業(yè)新增保單件數(shù)290.72億件,同比增長66.13%。其中,壽險本年新增累計保單0.89億件;健康險32.01億件,增長417.28%;意外險64.99億件,增長168.51%。
壽險、健康險及意外險年新增保單約98億件,均主要是與人相關(guān)的險種,因此在做營銷畫像可借助鐵路大數(shù)據(jù)達到更好的效果。假設(shè)保險機構(gòu)20%的客戶是通過鐵路大數(shù)據(jù)優(yōu)化經(jīng)營決策轉(zhuǎn)化的,每次調(diào)用接口費用3元,則可為中鐵帶來58.8億元的年收入規(guī)模(鐵路大數(shù)據(jù)單次使用總費用按3元,以下例子同理)。
(2)滿足保險機構(gòu)投保反欺詐需求
保險反欺詐主要針對車險及壽險產(chǎn)品,通過對鐵路大數(shù)據(jù)各維度的挖掘,結(jié)合外部風(fēng)險數(shù)據(jù),綜合判斷新增投保及存量續(xù)保客戶是否有投保欺詐行為的潛在風(fēng)險。
而2018年壽險本年新增累計保單0.89億件,車險4.48億件,假設(shè)其中20%的保單的反欺詐是通過鐵路大數(shù)據(jù)實現(xiàn)的,則可為中鐵帶來3.2億元的年收入規(guī)模。
(3)為旅游機構(gòu)提供經(jīng)營決策支持
2018年國內(nèi)旅游55.39億人次,而國家鐵路旅客發(fā)送量完成33.17億人次。鐵路旅客人次少于旅游人次,則可以鐵路人次數(shù)據(jù)作為評估標(biāo)準(zhǔn)。假設(shè)鐵路人次中有80%是通過鐵路出行旅游的(剩下20%為非旅游需求),則也有26.5億人次,其中平臺20%的用戶通過通過鐵路大數(shù)據(jù)優(yōu)化經(jīng)營決策轉(zhuǎn)化的,則可以帶來15.9億元的年收入規(guī)模。
(4)為銀行機構(gòu)提供經(jīng)營決策支持
隨著居民可支配結(jié)余資金的穩(wěn)定增長,國人們對理財?shù)臐撛谛枨笤诔掷m(xù)提升。同時,互聯(lián)網(wǎng)網(wǎng)民人數(shù)穩(wěn)定增長以及支付技術(shù)的快速發(fā)展等為互聯(lián)網(wǎng)理財?shù)陌l(fā)展提供了基礎(chǔ)。
截至2018年12月,我國購買互聯(lián)網(wǎng)理財產(chǎn)品的網(wǎng)民規(guī)模達1.51億,則各大平臺需要對共15億的注冊用戶進行資質(zhì)分層才能知道哪些是優(yōu)質(zhì)客群(轉(zhuǎn)化率按照10%反推計算注冊用戶數(shù)量),則可為中鐵帶來45億的年收入規(guī)模。
(5)為電商平臺提供經(jīng)營決策支持
截至2018年12月,我國網(wǎng)民規(guī)模為8.29億,假設(shè)電商平臺用戶基本覆蓋網(wǎng)民,則電商平臺用戶總數(shù)也為8.29億元,如每人每年需要消費一次,電商平臺需要對這些用戶進行資質(zhì)分層,判斷該向平臺用戶推送什么產(chǎn)品。假設(shè)平臺20%的用戶通過鐵路大數(shù)據(jù)優(yōu)化經(jīng)營決策轉(zhuǎn)化的,則可帶來近5億的年收入規(guī)模。
(6)為教育機構(gòu)提供經(jīng)營決策支持
2013年至2017年,畢業(yè)生總數(shù)從700萬人增至800萬人,年復(fù)合增長率為3.3%,并將于2022年達到930萬人。不斷增長的高校畢業(yè)生總數(shù)使其求職競爭更加激烈,畢業(yè)生們對職業(yè)技能培訓(xùn)的需求增加。
截至2018年上半年,在線教育人數(shù)達1.72億,按照年30%的增長率,新增部分人數(shù)是通過鐵路大數(shù)據(jù)優(yōu)化經(jīng)營決策轉(zhuǎn)化的,則可帶來1.5億元的年收入規(guī)模。
(7)為酒店平臺提供經(jīng)營決策支持
截至2018年12月,在線旅行預(yù)訂用戶規(guī)模達4.10億,較2017年底增長3423萬,增長率為9.1%,占網(wǎng)民整體比例達49.5%。網(wǎng)上預(yù)訂機票、酒店、火車票和旅游度假產(chǎn)品的網(wǎng)民比例分別為27.5%、30.3%、42.7%和14.5%。則酒店在線預(yù)訂用戶數(shù)量有近1.24億人,假設(shè)其中平臺30%的用戶通過鐵路大數(shù)據(jù)優(yōu)化經(jīng)營決策轉(zhuǎn)化的,則可帶來1.1億元的年收入規(guī)模。
(8)為網(wǎng)約車平臺提供經(jīng)營決策支持
截至2018年12月,我國網(wǎng)約出租車用戶規(guī)模達3.30億,假設(shè)其中平臺30%的用戶通過鐵路大數(shù)據(jù)優(yōu)化經(jīng)營決策轉(zhuǎn)化的,則可帶來2.97億元的年收入規(guī)模。
十、結(jié)語
除了以上場景外,現(xiàn)在使用數(shù)據(jù)比較成熟也比較愿意花錢的,其實都是金融或與金融相關(guān)的風(fēng)控場景、然后才是營銷獲客的客戶分層場景。而風(fēng)控場景除了公安、銀聯(lián)、運營商及設(shè)備數(shù)據(jù)算是比較易得及實現(xiàn)比較多外,包括鐵路數(shù)據(jù)這些國有數(shù)據(jù),99%的風(fēng)控人員都基本沒接觸過,更別說運用在風(fēng)控建模上了。
而現(xiàn)在大數(shù)據(jù)行業(yè)的發(fā)展已經(jīng)是國家重點推進的,因此可用的數(shù)據(jù)維度其實會越來越多,不僅風(fēng)控人員不僅需要時刻關(guān)注,并了解更多新的有效數(shù)據(jù)。各行各業(yè)與數(shù)據(jù)相關(guān)的其實都需要關(guān)注不同數(shù)據(jù)的應(yīng)用邏輯,保持?jǐn)?shù)據(jù)應(yīng)用敏感度,這才可以將可得數(shù)據(jù)在合規(guī)的前提最快的應(yīng)用起來,不管對內(nèi)還是對外。
主要參考材料:
- 基于出行全過程的旅客城市群出行方式選擇,研究基于大數(shù)據(jù)的鐵路客運用戶畫像系統(tǒng)研究及應(yīng)用
- 基于計劃行為學(xué)的旅客中長距離出行方式選擇行為研究
- 基于客票特征數(shù)據(jù)的我國高速鐵路旅客出行行為分析研究
- 基于鐵路出行數(shù)據(jù)的旅客常住地智能識別算法研究
- 其他網(wǎng)上公開相關(guān)材料
- 目前還沒評論,等你發(fā)揮!