什么是TGI指數(shù)?
TGI是英文Target Group Index的縮寫,直譯為“目標(biāo)群體指數(shù)”,即我們觀察的這部分群體,是否更多(或更少)分布在該維度上。本文作者對TGI指數(shù)進(jìn)行了分析,一起來看一下吧。
某出行平臺曾經(jīng)發(fā)布過一份數(shù)據(jù)分析報告,指出“凱迪拉克車主最愛去洗浴中心”,一時引來多方熱議。
我們今天討論的TGI概念,就與這個小故事有關(guān)。凱迪拉克車主是不是“更愛去洗浴中心”呢?這個問題,等我們了解了TGI之后再討論。
一、TGI是什么?
TGI是英文Target Group Index的縮寫,直譯為“目標(biāo)群體指數(shù)”。計算方法非常簡單:
TGI = [目標(biāo)群體中具有某一特征 的群體所占比例/總體中具有相同特征的群體所占比例]*100
在前司上班那會,我們在給客戶(廣告主)提供的消費者洞察分析報告中,頻繁的使用這個概念,以至于我們總監(jiān)曾經(jīng)專門組織過一次討論:該怎么更科學(xué)、更簡單地向客戶介紹TGI是什么,以及怎么理解它。
在向客戶解讀我的消費者報告時,我將TGI稱為目標(biāo)群體的傾向性指數(shù)。即,我們觀察的這部分群體,是否更多(或更少)分布在該維度上。
舉個簡單的例子。我在讀大學(xué)時,我們專業(yè)的男女比為1:3,即女生所占比例為75%。顯然,這是一個讓其他理工科專業(yè)男生十分羨慕的男女比,因為我們同級3000多人中,女生占比約為50%。
在這種情況下,我們專業(yè)女生性別TGI = 75%/50%*100 = 150。而TGI大于100,則說明我們專業(yè)中女生占比更高。
但是大家再考慮一種狀況:如果我們專業(yè)歸屬在女校之中(假設(shè)我們專業(yè)比較特殊,允許招收男生),那么大家還會覺得我們專業(yè)的女生更多嗎?
顯然不會。因為錨定的群體中,女生占比接近100%(因為還有我們幾個男生在,分子略小于分母),而我們專業(yè)中的女生比例只有75%,少于大盤。
讓我們回到一開始的小故事中。如果60%凱迪拉克車主都愛去洗浴中心,而整個豪車群體只有30%的車主愛去,那么凱迪拉克車主在“愛去洗浴中心”的TGI指數(shù)為60%/30%*100=200,遠(yuǎn)高于100,那么可以說凱迪拉克車主“更”愛去。
需要注意的是:如果只看60%這一單一的數(shù)字,我們無法是無法“更愛去”這個結(jié)論的,頂多說他們“愛去”。如果中國車主60%去洗浴中心,那么凱迪拉克車主并未表現(xiàn)出明顯的偏好性,只是符合一般規(guī)律而已。
所以,我們不能孤立地看待一個數(shù)據(jù),它只是一個冷冰冰的數(shù)字而已。我們必須將它帶入到具體的情景當(dāng)中,我們才能判斷這個數(shù)字是高還是低、是大還是小。
其中我們可以帶入的場景之一就是它所屬的群體里,即它的一個超集之中。
二、大數(shù)定律與品牌的同質(zhì)人群假設(shè)
我們上初中時就知道:當(dāng)擲硬幣的次數(shù)越多,正面出現(xiàn)的概率越來越趨近于0.5。
將大數(shù)定律延伸到我們的人群畫像中也類似、我們觀察的某個群體數(shù)量越多,其在某個特征的分布,應(yīng)該越來越趨近于整體大盤的分布水平。
考慮到大眾汽車銷量很高,并且在中國汽車市場上有較大的保有量,我們可以假設(shè)大眾車主的男女比例、省份分布,跟中國4.39億汽車車主的男女比例、省份分布應(yīng)該是類似的。即,子集在某個維度上的分布,應(yīng)該與大盤相同。
但是,我們經(jīng)常會發(fā)現(xiàn),子集在某個維度上的分布,比大盤要高或者低。那到底是什么因素導(dǎo)致的呢?
實際上,我們市場營銷理論的基石是“同質(zhì)人假說”——某個品牌的目標(biāo)消費者(Target Audience),是一群有著相似年齡、性別、地域、消費能力、價值觀的群體。比如,很多品牌官網(wǎng)上可能會明確介紹:我們品牌和產(chǎn)品,主要面向25-30歲的白領(lǐng)女性,她們居住在一線和新一線,追求新鮮的事物,等等。
同質(zhì)人假設(shè)有其合理性:一方面品牌可以更明確找到符合其特征的目標(biāo)消費者,可以有針對性地開發(fā)特定產(chǎn)品,并利用特定媒體渠道進(jìn)行廣告觸達(dá),即品牌更希望找到某一類人;另外一方面,從消費者的視角看,可以通過這些品牌定位和理念,來快速找到適合自己的產(chǎn)品和品牌,即某一類人也會找到適合自己的品牌。
同質(zhì)性假說造成的結(jié)果則是某個相似群體在某個品牌下的高度聚集。比如提到奔馳車主,我們就覺得這是一個有錢人的群體。
所以,如果我們觀察的群體,在某個維度上的分布,跟大盤相比出現(xiàn)了較大的異常(過高/過低),我們可以假設(shè)是品牌造成的這種差異(畢竟在真實社會中,要準(zhǔn)確計算某個因素的解釋力非常困難),而這往往可以評估品牌建立的有效性。
比如品牌A希望吸引25-30歲的一線白領(lǐng)女性,通過CRM數(shù)據(jù)分析發(fā)現(xiàn):該品牌符合這些條件的消費者占比是20%,比例與大盤中符合上述條件的人群占比一樣。我們可以認(rèn)為品牌形象并未成功建立;換句話說,即使品牌什么都不做,來消費者的中白領(lǐng)女性比例跟現(xiàn)在也沒什么差別。
我們在分析數(shù)據(jù)的時候,遇到TGI指數(shù)過高或者過低的維度,往往是一個突破口,我們可以在這個維度上繼續(xù)深挖。
三、咖啡與混淆變量
我是一個咖啡成癮者,每天午覺起來比都要來一杯咖啡,所以格外關(guān)注咖啡對健康的影響。事實上,咖啡對健康的研究經(jīng)常見之于媒體。
一份研究表明:
研究結(jié)果表明,喝咖啡的人平均每天要喝兩杯咖啡,包括脫咖啡因咖啡或速溶咖啡或研磨咖啡。他們患慢性肝病的風(fēng)險比不喝咖啡的人低21%,患慢性肝病或脂肪肝的風(fēng)險低20%。他們死于慢性肝病的可能性也降低了49%。
有趣的是,也有一些研究表明:“與完全不喝咖啡的人比較,一天喝1~5杯咖啡的人患心肌梗死的概率高1.34倍?!?/p>
作為咖啡愛好者,我當(dāng)然說服自己相信第一個研究的結(jié)論。
可是為什么這些研究的結(jié)論竟然會如此大相徑庭,甚至截然相反呢?
我對此的解釋是“混淆變量”。
第一份研究使用的數(shù)據(jù)是英國的Biobank 英國生物樣本庫。根據(jù)《維基百科》的介紹:該生物樣本庫始于2006年,對40~69 年齡段的500,000 名志愿者的各項生理指標(biāo)持續(xù)進(jìn)行觀測;抽樣人群主要來自生物樣本庫研究中心周邊10-20英里范圍內(nèi)的居民,“以城市人口居多”。
然而,年齡與經(jīng)濟(jì)水平也會直接影響“肝病”。因為也存在這樣一種可能性:收入越高的人,越有可能每天消費咖啡;同時,他們也能享受到更好的醫(yī)療服務(wù),獲得科學(xué)的飲食和鍛煉建議,這些因素可能也會影響慢性疾病的發(fā)病。因此,高咖啡消費與低慢性疾病發(fā)病率的相關(guān),可能也只是一種簡單的相關(guān)表象,背后的共同推手是“高收入”。
而認(rèn)為咖啡有害的研究中,除了咖啡導(dǎo)致心肌梗死這一種因果解釋之外,我們也可以假設(shè):需要經(jīng)常熬夜加班這一變量,是讓二者存在相關(guān)的共同推手——由于需要經(jīng)常熬夜加班,才會需要大量咖啡因的攝入來保持清醒;與此同時,熬夜加班也加大了心肌梗死的風(fēng)險。
這就是背后的“混淆變量”,簡單來說:Z導(dǎo)致了X,Z也導(dǎo)致了Y;乍看起來,X、Y存在因果或者相關(guān),因為它們經(jīng)常相伴相生。
而這跟TGI又有什么關(guān)系呢?
如果你看到一個數(shù)據(jù):未患脂肪肝的人群中,70%的人都是咖啡愛好者,TGI指數(shù)是170;而患有脂肪肝的人,35%是咖啡愛好者,TGI指數(shù)是85。
這是否意味著喝咖啡能減少得脂肪肝的可能性呢?
通過上面混淆變量的分析,你會堅定地否定這一想法。
TGI指數(shù)也只是一個數(shù)字,我們可以通過過高或者過低的TGI去尋求進(jìn)一步的人群的洞察,但是不意味著這個維度就能對群體的形成具有解釋力。
專欄作家
簡寫2019,人人都是產(chǎn)品經(jīng)理專欄作家。理性派,思考本質(zhì)問題。堅定地用數(shù)據(jù)和結(jié)構(gòu)化解決一切問題。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
理解博主想輸出的邏輯,但是咖啡降低肝病風(fēng)險和提升心肌梗死的風(fēng)險本身就是兩個事情,涉及到是兩條鏈路,本身就互不相干。換句話說,并不能因為咖啡可能降低肝疾病風(fēng)險,就證明它不可能提升心肌梗死風(fēng)險。
某個群體的特質(zhì)并不代表這一類群體,總體的選擇范圍不同,得出的結(jié)果也就不同
學(xué)到了,某個群體的用戶特征并不代表這一類群體。
學(xué)到了,通過各種定義指數(shù)確實能夠在一定范圍內(nèi)對用戶行為做出判斷和研究,但也并不是全部,指數(shù)不能完全性依賴。