增長(zhǎng)黑客AB-Testing系統(tǒng)設(shè)計(jì)
編輯導(dǎo)語(yǔ):增長(zhǎng)黑客這一概念起源于美國(guó)互聯(lián)網(wǎng)行業(yè),最早由 Sean Ellis 提出。近年來(lái),增長(zhǎng)黑客的概念傳到國(guó)內(nèi),其核心是驅(qū)動(dòng)用戶飛漲增長(zhǎng)黑客,指的是創(chuàng)業(yè)型團(tuán)隊(duì)在數(shù)據(jù)分析基礎(chǔ)上,利用產(chǎn)品或技術(shù)手段來(lái)獲取自發(fā)增長(zhǎng)的運(yùn)營(yíng)手段。本文作者詳細(xì)的分析了增長(zhǎng)黑客的AB-Testing系統(tǒng)應(yīng)該如何設(shè)計(jì),希望對(duì)你有所幫助。
一、AB-test思路
數(shù)據(jù)驅(qū)動(dòng)概念興起的同時(shí),AB-test也同步出現(xiàn)在大家的視線中,各互聯(lián)網(wǎng)大廠率先引進(jìn)了AB-test系統(tǒng),希望通過(guò)循環(huán)的測(cè)試,上線最符合公司客群的產(chǎn)品。
這一理念一出引發(fā)行業(yè)內(nèi)各個(gè)公司的效仿,各種宣導(dǎo)紛至而來(lái),那么什么是AB-test?什么樣的公司能迅速構(gòu)建出AB-test系統(tǒng)?我們今天來(lái)一起聊一下。
1. 什么是AB-test?
攜程的大佬們?cè)o出一個(gè)定義:AB試驗(yàn)可以簡(jiǎn)單的認(rèn)為是傳入一個(gè)實(shí)驗(yàn)號(hào)和用戶分流ID到AB試驗(yàn)分流器,分流器吐出分流版本A、B、C、D等,截取一部分應(yīng)用流量,落地某一段時(shí)間的分流數(shù)據(jù),進(jìn)而分析各個(gè)版本的優(yōu)劣,決定啟用新版本還是沿用老版本的過(guò)程。
這一定義大家能不能理解呢?我們用更通俗的語(yǔ)言做一下解讀:
首先:試驗(yàn)的目的是為了決策新開(kāi)發(fā)的兩個(gè)或兩個(gè)以上的版本該上線哪一個(gè)的問(wèn)題——即當(dāng)有較多的版本選擇時(shí)可以先測(cè)一把,讓數(shù)據(jù)告訴我們哪一個(gè)方案比較適合我們公司的客戶。
大家有沒(méi)有遇到經(jīng)驗(yàn)失效的時(shí)候,就是我們按照自己的經(jīng)驗(yàn)設(shè)計(jì)出來(lái)的產(chǎn)品、活動(dòng),客戶并不買賬,失效的原因有很多,其中一個(gè)比較常見(jiàn)的原因就是經(jīng)驗(yàn)失效,即我們培養(yǎng)起來(lái)的經(jīng)驗(yàn)往往是根據(jù)之前公司或者歷史數(shù)據(jù)形成的。
問(wèn)題在于新公司/當(dāng)下時(shí)間中客群發(fā)生了變化,我們之前的經(jīng)驗(yàn)未必完全符合現(xiàn)在的客群,這也就凸顯出了AB-test的價(jià)值,AB-test是根據(jù)本公司現(xiàn)在的客群進(jìn)行的對(duì)照試驗(yàn),可以直觀的表達(dá)出客戶需要什么樣的產(chǎn)品。
其次:試驗(yàn)用到的一個(gè)重要組件是分流器,分流器有什么用處呢?
顧名思義——分流用的,就是通過(guò)一定的規(guī)則將APP中隨時(shí)流動(dòng)的數(shù)據(jù)分成多個(gè)版本,客戶進(jìn)入APP后會(huì)自動(dòng)分配到各個(gè)版本中,各個(gè)版本對(duì)應(yīng)開(kāi)發(fā)的新舊版本,進(jìn)行穩(wěn)定測(cè)試。
分流器中常用的方法是對(duì)客戶的session/cookie進(jìn)行hash運(yùn)算,然后將運(yùn)算結(jié)果取模mod(即取余運(yùn)算,不清楚的看官可以百度一下)。通過(guò)取模后的值進(jìn)行分流,分流的過(guò)程涉及正交、互斥試驗(yàn)的設(shè)計(jì),其中細(xì)節(jié),我們下文中會(huì)詳細(xì)描述。
其三:就是試驗(yàn)效果評(píng)估的過(guò)程,AB-test的兩個(gè)重點(diǎn)之一就是效果評(píng)估(另一個(gè)就是上面的分流器),如何評(píng)估一個(gè)試驗(yàn)是否成功?試驗(yàn)1的UV大于試驗(yàn)2的UV是否就說(shuō)明試驗(yàn)1是好的?
這其中就涉及到了統(tǒng)計(jì)中的各種檢驗(yàn)知識(shí),我們會(huì)在下文原理部分詳細(xì)描述。
現(xiàn)在我們從簡(jiǎn)到繁了解一下AB-test的試驗(yàn)思路,假設(shè)一個(gè)客戶來(lái)到我們的APP,其在AB-test中的數(shù)據(jù)訪問(wèn)可以如下圖描述:
看圖聽(tīng)故事如下:
- 一個(gè)客戶進(jìn)入到我們的APP時(shí),會(huì)在客群的部分做一次篩選,即試驗(yàn)是否是有劃分客群,如果有客群劃分,則需要判斷新來(lái)的客戶是否命中我們的試驗(yàn)客群;
- 第二步我們要判斷需要進(jìn)行什么類型的試驗(yàn),正交還是互斥?以及此次試驗(yàn)需要切分多少流量,5%還是10%;
- 經(jīng)過(guò)了客群識(shí)別和流量切分后,我們的客戶來(lái)到了試驗(yàn)分組部分,系統(tǒng)采集客戶訪問(wèn)的cookie/session信息計(jì)算出唯一hash值,并對(duì)這一hash值做mod處理;
- mod處理之后的數(shù)據(jù)會(huì)被分到t個(gè)桶中的某一個(gè),然后再根據(jù)一定的比例和算法將t個(gè)桶中的數(shù)據(jù)分成三組,即:A組、A組和B組,假設(shè)分流比例為:1/3,1/3,1/3;
- A-A組即為舊版本對(duì)照組,用來(lái)檢驗(yàn)分流是否有效,如果A-A組不顯著,說(shuō)明數(shù)據(jù)不受系統(tǒng)性因子影響,分流是有效的;A-B組即為新舊版本的對(duì)照組,其中B組為新版本;
- A-A-B組的數(shù)據(jù)比較即為試驗(yàn)數(shù)據(jù)分析,分析人員借此完成試驗(yàn)的效果檢驗(yàn),確定試驗(yàn)是否顯著。
看完上面這一串介紹,有沒(méi)有一種原來(lái)如此的感覺(jué)?
AB-test的基本流程可以是上圖的樣式,但是充其量只能作為一個(gè)簡(jiǎn)圖,接下來(lái)我們一點(diǎn)點(diǎn)的抽絲剝繭,還原AB-test產(chǎn)品的真相:
2. 什么是正交試驗(yàn)?什么是互斥試驗(yàn)?
正交試驗(yàn):每個(gè)獨(dú)立試驗(yàn)為一層,為保證各層之間不相互影響,一份流量穿越每層試驗(yàn)時(shí),會(huì)再次隨機(jī)打散,且隨機(jī)效果離散,這一過(guò)程叫正交,這樣的試驗(yàn)叫正交試驗(yàn)。
正交試驗(yàn)?zāi)茏畲蠡谋WC各層試驗(yàn)相互獨(dú)立,確保各個(gè)試驗(yàn)不會(huì)相互影響。
我們用圖形來(lái)表示正交,如下圖:
X層的全部流量隨機(jī)打散,然后進(jìn)入到Y(jié)層,看到的結(jié)果即為Y層的流量為X層流量重組之后的再分配,兩層之間相互獨(dú)立。
互斥試驗(yàn):即為在同一層中拆分流量,且不論如何拆分,不同的流量是不重疊的。
互斥試驗(yàn)是在流量足夠的情況下進(jìn)行的分流策略,各個(gè)試驗(yàn)之間也不會(huì)相互影響。我們同樣用圖形來(lái)表示互斥,如下圖:
X層的流量會(huì)各自獨(dú)立的分到Y(jié)層,相互之間不受影響。
3. 如何計(jì)算最小樣本量?
最小樣本量的計(jì)算,我們會(huì)在下文原理篇詳細(xì)講解~
4. 多個(gè)試驗(yàn)同時(shí)發(fā)生時(shí)如何分層?
前面我們講解了正交和互斥兩個(gè)原則,接下來(lái)我們介紹一下在正交和互斥的原則下該如何設(shè)計(jì)試驗(yàn)分層?
正交、互斥兩種試驗(yàn)的引用是為了能夠更充分、更高效的使用流量,實(shí)際試驗(yàn)中往往是多組試驗(yàn)同時(shí)存在,既有正交,又有互斥,如下圖:
上圖中的分組情況可以看出:域1和域2互斥拆分流量,域2中的流量串過(guò)1-1層、1-2層、1-3層,進(jìn)入到2層和3層,1-1層、1-2層、1-3層是互斥的,1層、2層、3層是正交的,上層的流量大于等于下層。
從使用場(chǎng)景上看,1層、2層、3層可能分別為UI層、搜索結(jié)果層、廣告結(jié)果層,這幾個(gè)層級(jí)基本上沒(méi)有任何的業(yè)務(wù)關(guān)聯(lián)度,即使共用相同的流量,也不會(huì)對(duì)實(shí)際的業(yè)務(wù)造成影響。
但是如果不同層之間所進(jìn)行的試驗(yàn)相互關(guān)聯(lián),就需要進(jìn)行互斥試驗(yàn)。
例如:1-1層是修改頁(yè)面按鈕上文字的顏色,1-2層是修改按鈕顏色,如果按鈕和文字顏色一致,估計(jì)按鈕就不可用了。試驗(yàn)的基本原則是控制變量,即盡可能的保證每次試驗(yàn)只有一個(gè)變量,不要讓一個(gè)變量的試驗(yàn)動(dòng)態(tài)影響另一個(gè)變量試驗(yàn),否則試驗(yàn)就會(huì)失去公正性。
另外,如果我們覺(jué)得一個(gè)試驗(yàn)可能會(huì)對(duì)新老客戶產(chǎn)生完全不同的影響,那么就應(yīng)該對(duì)新客戶和老客戶分別展開(kāi)定向試驗(yàn),觀察結(jié)論。
無(wú)論從層級(jí)上還是單層的分流上都被充分應(yīng)用,流量的使用效率很高,但是,隨著試驗(yàn)越來(lái)越多,對(duì)試驗(yàn)的管理也會(huì)顯得越來(lái)越重要,往往后期會(huì)需要專門的人員進(jìn)行管理。
5. Hash分流過(guò)程是啥樣的?
分流的方式有很多種,筆者這次來(lái)和大家聊一下hash的算法如何實(shí)現(xiàn)分流效果。
AB-test又稱作是桶測(cè)試,為什么叫桶測(cè)試呢?關(guān)鍵就在于分流的過(guò)程,我們先解釋一下桶和試驗(yàn)組的關(guān)系:
假設(shè)試驗(yàn)有12個(gè)人,我們對(duì)這12個(gè)人進(jìn)行編號(hào),編號(hào)方法可以使用cookie,也可以使用session,總之獲取到這12個(gè)人的唯一編碼。
當(dāng)獲取到唯一編碼之后我們就可以開(kāi)始分流了,我們對(duì)每個(gè)人的唯一編碼進(jìn)行hash處理,常規(guī)使用MD5進(jìn)行hash計(jì)算,這樣計(jì)算的好處在于MD5幾乎不會(huì)重復(fù),分流效果較好。
計(jì)算好的hash值需要進(jìn)行mod處理,圖中有6個(gè)桶,我們就用6進(jìn)行mod處理, 12個(gè)人按照余數(shù)分散到六個(gè)桶里面,原則上12個(gè)人的分流是隨機(jī)的分散到各個(gè)桶里面,很難保證每個(gè)桶里的人數(shù)一致。
但是從統(tǒng)計(jì)學(xué)的角度上講,當(dāng)數(shù)據(jù)量足夠大時(shí),數(shù)據(jù)會(huì)均勻的分散到各個(gè)桶里面。
桶分流完成后,我們需要處理的就是將這些桶平均分成兩組,原則是保證隨機(jī)性和平均分配,聰明如你,應(yīng)該已經(jīng)明白分流的原理了吧?
6. Hash分流是否能保證樣本在A-A-B三組中平衡分布?
三組數(shù)據(jù)的分流原則上需要盡可能平衡,即各個(gè)特征都能均勻的分布在三組試驗(yàn)中,這樣才能符合AB-test控制變量的原則。
生化試驗(yàn)中控制變量是一個(gè)較為簡(jiǎn)單的問(wèn)題,不管是脊蛙反射還是腸胃蠕動(dòng)試驗(yàn);但是社會(huì)學(xué)中的試驗(yàn),控制變量卻異常復(fù)雜,因?yàn)槊鎸?duì)大量人群,很難通過(guò)隨機(jī)分配保證各個(gè)特征的平衡,而且有些隱含變量很難被發(fā)現(xiàn),也難以做到平衡。
這樣的問(wèn)題稱在生化試驗(yàn)中稱作是系統(tǒng)誤差,在互聯(lián)網(wǎng)AB-test中則會(huì)引發(fā)辛普森悖論。
生化試驗(yàn)中往往通過(guò)重復(fù)試驗(yàn)來(lái)避免,互聯(lián)網(wǎng)下的AB-test很難進(jìn)行重復(fù)試驗(yàn),因?yàn)闊o(wú)法讓一個(gè)人即使用A版本,又使用B版本,串行試驗(yàn)又會(huì)添加時(shí)間因素,所以只能采用其他的方式解決這個(gè)問(wèn)題。
那么,什么是辛普森悖論呢?
我們用一個(gè)真實(shí)的醫(yī)學(xué) AB 測(cè)試案例來(lái)說(shuō)明這個(gè)問(wèn)題,這是一個(gè)腎結(jié)石手術(shù)療法的 AB 測(cè)試結(jié)果:
看上去無(wú)論是對(duì)于大型結(jié)石還是小型結(jié)石,A療法都比B療法的療效好。但是總計(jì)而言,似乎B療法比A療法要好。
這個(gè)AB測(cè)試的結(jié)論是有巨大問(wèn)題的,無(wú)論是從細(xì)分結(jié)果看,還是從總計(jì)結(jié)果看,都無(wú)法真正判斷哪個(gè)療法好。
那么,問(wèn)題出在哪里呢?
這個(gè)AB測(cè)試的兩個(gè)實(shí)驗(yàn)組的病歷選取有問(wèn)題,都不具有足夠的代表性。
參與試驗(yàn)的醫(yī)生人為的制造了兩個(gè)試驗(yàn)組本身不相似,因?yàn)獒t(yī)生似乎覺(jué)得病情較重的患者更適合A療法,病情較輕的患者更適合B療法。所以下意識(shí)的在隨機(jī)分配患者的時(shí)候,讓A組里面大結(jié)石病歷要多,而B(niǎo)組里面小結(jié)石病歷要多。
更重要的問(wèn)題是:很有可能影響患者康復(fù)率的最重要因素并不是療法的選擇,而是病情的輕重!換句話說(shuō),A療法之所以看上去不如B療法,主要是因?yàn)锳組病人里重病患者多,并不是因?yàn)锳組病人采用A療法。
所以,這一組不成功的AB測(cè)試,問(wèn)題出在試驗(yàn)流量分割的不科學(xué),主要是因?yàn)榱髁糠指詈雎粤艘粋€(gè)重要的“隱藏因素”,也就是病情輕重。
正確的試驗(yàn)實(shí)施方案里,兩組試驗(yàn)患者里,重病患者(也就是AB-test中的特征值)的比例應(yīng)該保持一致。
我們?cè)賮?lái)聊一個(gè)互聯(lián)網(wǎng)領(lǐng)域的場(chǎng)景:我們對(duì)APP上一個(gè)按鈕進(jìn)行了顏色調(diào)整,需要比較一下顏色調(diào)整前后用戶UV點(diǎn)擊率是否提高?
經(jīng)過(guò)一段時(shí)間的試驗(yàn),我們得到了兩組試驗(yàn)的數(shù)據(jù),為了說(shuō)明辛普森悖論的問(wèn)題,我們單獨(dú)抽離出了性別作為比較。
原因有二:一是性別在這次試驗(yàn)中是重要特征;二是這一特征的數(shù)據(jù)不均衡,剛好出現(xiàn)了辛普森問(wèn)題。計(jì)算出了兩組試驗(yàn)的點(diǎn)擊率,如下:
數(shù)據(jù)中我們發(fā)現(xiàn):?jiǎn)为?dú)看這一試驗(yàn),無(wú)論是女性特征和男性特征,數(shù)據(jù)表現(xiàn)都是A組中較好。但是,總計(jì)卻是B組效果較好,其中的差異我想大家已經(jīng)清楚了,性別特征并沒(méi)有均衡的分布在兩個(gè)試驗(yàn)組中。
這個(gè)解決方法就是——定向試驗(yàn)。
在進(jìn)行試驗(yàn)之前,先做一次試驗(yàn)分析,確定對(duì)試驗(yàn)影響較大的因素,然后通過(guò)分流的權(quán)重設(shè)置來(lái)均衡各個(gè)組之間的特征差異,因素確認(rèn)用到的方法較多,比如GBDT等等。
如下圖:
在進(jìn)行試驗(yàn)同時(shí),可以實(shí)現(xiàn)各分組特征中的監(jiān)控。如果發(fā)現(xiàn)某一特征在某一組中偏小,就增加這一特征在這一組的分配權(quán)重,以保證特征一致性。
但是這樣也存在特征取舍的問(wèn)題,具體就不展開(kāi)來(lái)描述了,有興趣的小伙伴可以自行查詢一下。畢竟,能做到這一點(diǎn)的公司已經(jīng)很不錯(cuò)了。
分層試驗(yàn),交叉試驗(yàn),定向試驗(yàn)是我們規(guī)避辛普森悖論的有力工具。
規(guī)避辛普森悖論,還要注意流量動(dòng)態(tài)調(diào)整變化的時(shí)候新舊試驗(yàn)參與者的數(shù)據(jù)問(wèn)題,試驗(yàn)組和對(duì)照組用戶數(shù)量的差異問(wèn)題,以及其他各種問(wèn)題。
而優(yōu)秀的增長(zhǎng)黑客,不會(huì)去投機(jī)取巧“制造數(shù)據(jù)”,而是認(rèn)真思考和試驗(yàn),用科學(xué)可信的數(shù)據(jù)來(lái)指導(dǎo)自己和企業(yè)的決策,通過(guò)無(wú)數(shù)次失敗的和成功的AB測(cè)試試驗(yàn),總結(jié)經(jīng)驗(yàn)教訓(xùn),變身能力超強(qiáng)的超級(jí)英雄。
二、AB-testing原理
統(tǒng)計(jì)計(jì)算主要應(yīng)用在效果評(píng)估領(lǐng)域。
客戶經(jīng)過(guò)分流之后在各個(gè)試驗(yàn)組中產(chǎn)生數(shù)據(jù),統(tǒng)計(jì)的作用即為查看對(duì)應(yīng)組的樣本量是否達(dá)到最小樣本量,數(shù)據(jù)之間是否存在顯著性差異,以及進(jìn)行差異大小的比較。
如下圖:
A-A-B三組數(shù)據(jù)觀察n天后,會(huì)產(chǎn)生3組數(shù)據(jù),我們接下來(lái)的任務(wù)就是計(jì)算這三組數(shù)據(jù)的統(tǒng)計(jì)效果,進(jìn)而確定哪個(gè)方案效果好。
1. 如何計(jì)算最小樣本量?
最小樣本量是按照統(tǒng)計(jì)功效進(jìn)行計(jì)算的,主要分兩類:絕對(duì)值類(例如:UV)和比率類(例如:點(diǎn)擊率)。
在試驗(yàn)過(guò)程中,大部分場(chǎng)景是進(jìn)行比率類指標(biāo)的比較,單純的計(jì)算絕對(duì)值是沒(méi)有價(jià)值的;而且對(duì)于試驗(yàn)效果來(lái)講,絕對(duì)值的比較可以轉(zhuǎn)化為比率的比較。
所以在計(jì)算過(guò)程中,我們統(tǒng)一成比率計(jì)算,以方便口徑統(tǒng)一和數(shù)值比較。
理論上,比率類最小樣本量計(jì)算:
例如:“XX提交”按鈕由紅色變?yōu)槌壬?,統(tǒng)計(jì)的指標(biāo)是點(diǎn)擊UV轉(zhuǎn)化率UV_rate,測(cè)試時(shí)間是20200801~20200814,則計(jì)算“XX提交”按鈕的歷史月均值mean(UV_rate)為下面數(shù)據(jù)的均值avg(UV_rate):
注:此處的計(jì)算需要對(duì)統(tǒng)計(jì)學(xué)中的統(tǒng)計(jì)功效有所了解,閱讀有阻力可以補(bǔ)充一下“統(tǒng)計(jì)功效”的計(jì)算方法。
流程圖介紹:最小樣本量的作用是確定試驗(yàn)是否有效,后管配置好對(duì)應(yīng)的客群信息、開(kāi)放流量占比、提升率等信息后,后臺(tái)需要進(jìn)行“最小樣本量”的計(jì)算,并進(jìn)行相關(guān)判斷,如下圖:
2. 如何計(jì)算試驗(yàn)有效天數(shù)?
補(bǔ)充——統(tǒng)計(jì)功效:
確定好最小樣本量并實(shí)現(xiàn)分流、試驗(yàn)上線之后,需要進(jìn)行數(shù)據(jù)的有效天數(shù)需要進(jìn)行相應(yīng)計(jì)算:
試驗(yàn)的有效天數(shù)即為試驗(yàn)進(jìn)行多少天能達(dá)到流量的最小樣本量。
當(dāng)流量達(dá)到最小樣本量時(shí),查看數(shù)據(jù)是否存在顯著性差異,如果不存在顯著性差異則繼續(xù)進(jìn)行試驗(yàn),直到達(dá)到最大要求天數(shù);如果試驗(yàn)仍然沒(méi)有達(dá)到顯著性,則確定兩組試驗(yàn)不顯著,即沒(méi)有明顯差異。
計(jì)算過(guò)程如圖:
如果到達(dá)試驗(yàn)最小天數(shù)且試驗(yàn)樣本量>=最小樣本量n_per,則觀察試驗(yàn)是否有顯著性,如果A-A試驗(yàn)沒(méi)有顯著性且A-B存在顯著性(B>A),則表示試驗(yàn)成功,否則試驗(yàn)失敗。
如果到達(dá)試驗(yàn)最小天數(shù)且試驗(yàn)樣本量<最小樣本量n_per,則繼續(xù)進(jìn)行試驗(yàn);
3. 判斷試驗(yàn)天數(shù)是否到達(dá)試驗(yàn)最大天數(shù)(t天):
如果到達(dá)試驗(yàn)最大天數(shù)且試驗(yàn)樣本量>=最小樣本量n_per,則觀察顯著性;如果到達(dá)試驗(yàn)最大天數(shù)且試驗(yàn)樣本量<最小樣本量n_per,則終止試驗(yàn)并標(biāo)注試驗(yàn)失敗。
邏輯流程圖為:
通過(guò)每天的數(shù)據(jù)計(jì)算可以做出如上判斷,進(jìn)而確定試驗(yàn)進(jìn)行的有效天數(shù)并計(jì)算出顯著性水平。
三、AB-testing工程化
經(jīng)過(guò)上面的描述,我們可以通過(guò)下面的兩張圖來(lái)了解一下在工程方面,AB測(cè)試系統(tǒng)是什么樣子的:
注釋:
- 根據(jù)需求設(shè)計(jì)好AB試驗(yàn)之后,在AB測(cè)試系統(tǒng)配置好對(duì)應(yīng)的策略;
- 將這一策略固化成文件,并推送到APP的AB系統(tǒng)SDK中;
- 客戶每次訪問(wèn)APP,先掃描AB系統(tǒng)SDK中的策略文件,根據(jù)策略文件給客戶打標(biāo),分配對(duì)應(yīng)的A、B版本;
- APP中根據(jù)策略呈現(xiàn)A、B版本的試驗(yàn)內(nèi)容,并監(jiān)控客戶的操作行為以及訂單行為;
- 這一行為被記錄并上報(bào)到大數(shù)據(jù)環(huán)境中;
- 天在大數(shù)據(jù)中進(jìn)行顯著性計(jì)算和最小樣本量的處理,得到對(duì)應(yīng)的顯著性結(jié)果。
我們?cè)賮?lái)看一個(gè)詳細(xì)的系統(tǒng)數(shù)據(jù),如下圖:
目前為止,AB系統(tǒng)已經(jīng)介紹完成了,AB的結(jié)構(gòu)深不可測(cè),其中也需要經(jīng)常的更新和討論,歡迎大家關(guān)注溝通~
作者:野水晶體;個(gè)人公眾號(hào):livandata
本文由 @野水晶體 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Pexels,基于 CC0 協(xié)議
詳細(xì)的討論了辛普森悖論和解決方法 提出的定向?qū)嶒?yàn)用樹(shù)模型來(lái)評(píng)估特征重要度并據(jù)此來(lái)平衡兩組間重要特征分布的做法,引人入勝 非常受啟發(fā)
馬
歡迎大家關(guān)注公眾號(hào):livandata,內(nèi)容更全面詳細(xì)~
謝謝很干貨,不知道是否有機(jī)會(huì)聯(lián)絡(luò)一下。
企業(yè)的痛有三:一曰戰(zhàn)略,二曰組織,三即為產(chǎn)品,這其中,處處少不了增長(zhǎng)~
看完后只是覺(jué)得樓主挺適合做學(xué)術(shù)研究的
為啥?全從原理入手?
硬核攻略,收藏+點(diǎn)贊+分享三連走起
感謝~