一文獨懂抖音、小紅書、視頻號三大主流平臺的推薦和審核機(jī)制

0 評論 4950 瀏覽 32 收藏 9 分鐘

最近一直在研究三大視頻平臺的機(jī)制,了解推薦、審核機(jī)制也能更好的做視頻的整體工作。此文將今日研究的一些成果做一些記敘。

抖音:行為預(yù)測主導(dǎo)的去中心化推薦

抖音采用深度學(xué)習(xí)模型+去中心化推薦機(jī)制,通過神經(jīng)網(wǎng)絡(luò)預(yù)估用戶行為,機(jī)器判斷比傳統(tǒng)的用戶標(biāo)簽更靈活。

抖音的內(nèi)容分發(fā)流程主要分為三個階段:

1. 視頻審核階段

視頻在進(jìn)入冷啟動前,會進(jìn)行機(jī)器初判階段。此時,就要根據(jù)口播文案、視頻字幕文案、畫面等內(nèi)容進(jìn)行合規(guī)性判斷。通過AI識別文本、圖像、聲音中的違規(guī)內(nèi)容,包括侵權(quán)、低俗、違法違規(guī)、誘導(dǎo)、虛假宣傳等。然后進(jìn)入到冷啟動階段,此時會進(jìn)入到200-500人的流量池。

2. 算法推薦階段

通過多模態(tài)特征識別技術(shù),對視頻內(nèi)容進(jìn)行深度分析

  • 文本特征:通過NLP技術(shù)解析標(biāo)題和字幕中的關(guān)鍵詞
  • 視覺特征:利用圖像識別技術(shù)提取視頻中的畫面元素
  • 音頻特征:通過聲紋分析捕捉語音講解中的關(guān)鍵詞頻率

平臺根據(jù)“打分機(jī)制”來評判視頻后續(xù)的推薦,完播率、點贊率、評論率、轉(zhuǎn)發(fā)率等用戶行為指標(biāo)綜合計算。

抖音的推薦算法已幾乎不依賴對內(nèi)容和用戶打標(biāo)簽,而是通過神經(jīng)網(wǎng)絡(luò)直接預(yù)測用戶行為,計算用戶觀看內(nèi)容獲得的價值總和。

3. 流量分配機(jī)制

多樣性打散:打破 “相似內(nèi)容連續(xù)轟炸”

算法會在推薦列表中主動 “打散” 高度相似的 AIGC 內(nèi)容。

多興趣召回:挖掘用戶的 “隱藏興趣點”

傳統(tǒng) “單興趣召回” 僅針對用戶最明顯的興趣(如 “AI 搞笑視頻”),而多興趣召回會通過用戶行為數(shù)據(jù)(如瀏覽時長、搜索記錄、評論關(guān)鍵詞)識別多個興趣標(biāo)簽。

小紅書:CES評分驅(qū)動的標(biāo)簽匹配系統(tǒng)

小紅書的推薦算法以CES評分(社區(qū)參與度評分)為核心

采用”內(nèi)容標(biāo)簽+用戶標(biāo)簽”的雙向匹配機(jī)制

CES評分公式為:CES=點贊數(shù)(1分)+收藏數(shù)(1分)+評論數(shù)(4分)+轉(zhuǎn)發(fā)數(shù)(4分)+關(guān)注數(shù)(8分)

內(nèi)容識別流程:

  • 初始流量池:筆記發(fā)布后進(jìn)入500-1000人的初始測試池
  • 標(biāo)簽匹配:通過NLP技術(shù)提取標(biāo)題/正文中的關(guān)鍵詞,與用戶興趣標(biāo)簽匹配
  • CES評分評估:系統(tǒng)根據(jù)互動數(shù)據(jù)(評論、關(guān)注、收藏、點贊、轉(zhuǎn)發(fā))計算CES分?jǐn)?shù),決定是否進(jìn)入下一級流量池

小紅書內(nèi)容的“互動率”(點贊、評論、收藏)是突破幼稚內(nèi)容的關(guān)鍵。這三項是推薦優(yōu)質(zhì)筆記進(jìn)入1w~100w流量池差異化的關(guān)鍵。

優(yōu)質(zhì)內(nèi)容會按順序進(jìn)入覆蓋 1 萬、10 萬、100 萬以上用戶的展示范圍,其中用戶的互動表現(xiàn)(如點贊、評論、收藏等行為的綜合占比)是實現(xiàn)層級突破的關(guān)鍵因素。

小紅書的召回周期很長,即使發(fā)布2-3個月的視頻也會被找回進(jìn)行流量推送,更注重長尾瀏覽。所以做小紅書一定要注重圖文質(zhì)量和實際功能性的內(nèi)容,通過“搜索”還可以推薦到優(yōu)質(zhì)內(nèi)容。

視頻號:私域撬動公域的社交推薦體系

視頻號的推薦算法與抖音、快手等平臺有本質(zhì)區(qū)別,其核心邏輯是”私域流量撬動公域流量”,內(nèi)容權(quán)重在三大平臺中最低,約占50%,社交關(guān)系鏈權(quán)重較高。

推薦機(jī)制:

  • 私域流量推薦:用戶點贊和互動后,其微信好友可能看到該內(nèi)容,通過社交關(guān)系鏈形成第一波推薦
  • 興趣算法推薦:基于用戶行為標(biāo)簽與內(nèi)容特征標(biāo)簽的匹配,進(jìn)行個性化推薦

內(nèi)容審核流程:

  1. 上傳視頻并解碼
  2. 機(jī)器審核文案、畫面、聲音是否存在違規(guī)行為
  3. 機(jī)器無法識別的內(nèi)容,喚起人工審核
  4. 若作品已發(fā)布且被舉報或流量異常,再次觸發(fā)人工審核

違規(guī)判定標(biāo)準(zhǔn):視頻號對直播內(nèi)容的審核更為嚴(yán)格,禁止錄播、低互動行為、虛假演繹等

同時,平臺對內(nèi)容原創(chuàng)性、畫質(zhì)清晰度、互動真實性均有要求,私域流量中的”好友互動異常”(如短時間內(nèi)大量點贊)可能被判定為違規(guī)

流量分配特點:視頻號的流量分配更依賴社交關(guān)系鏈,初始流量主要來自關(guān)注者、好友和社群的自然流量,隨后基于地理位置、興趣標(biāo)簽等進(jìn)行基礎(chǔ)推薦

內(nèi)容得分排序權(quán)重為:完播率>點贊數(shù)>評論數(shù)>點擊擴(kuò)展鏈接數(shù)量>轉(zhuǎn)發(fā)數(shù)>收藏數(shù)

文本NLP拆詞機(jī)制解析

抖音:子詞級分詞與深度語義理解

抖音的文本NLP處理采用子詞級分詞技術(shù),主要基于以下方法:

  • 分詞基礎(chǔ)算法:抖音使用前向最大匹配算法進(jìn)行基礎(chǔ)分詞,同時結(jié)合BERT或RoBERTa等預(yù)訓(xùn)練模型進(jìn)行語義分析。
  • 關(guān)鍵詞提?。憾兑舻腘LP系統(tǒng)通過多模態(tài)特征提取技術(shù),識別視頻中的關(guān)鍵信息。文本特征提取主要依靠雙向Transformer架構(gòu),能夠同時考慮前后文信息,提高關(guān)鍵詞提取的準(zhǔn)確性。
  • 標(biāo)簽化過程:抖音的標(biāo)簽化主要通過神經(jīng)網(wǎng)絡(luò)計算實現(xiàn),系統(tǒng)會根據(jù)內(nèi)容特征和用戶行為,自動為視頻打上精準(zhǔn)的標(biāo)簽。這種標(biāo)簽化方式不再依賴傳統(tǒng)的人工打標(biāo)簽,而是通過算法模型自動完成,更加高效和精準(zhǔn)。

小紅書:詞典匹配與長尾詞優(yōu)化

小紅書的文本NLP處理更注重關(guān)鍵詞布局與搜索優(yōu)化,其分詞機(jī)制主要基于以下方法:

  • 分詞基礎(chǔ)算法:小紅書主要采用基于詞典的分詞算法,如正向最大匹配、逆向最大匹配等。
  • 關(guān)鍵詞優(yōu)化策略:小紅書強調(diào)“七三原則”,即日常更新內(nèi)容時,建議70%是做長尾詞。
  • 標(biāo)簽化技術(shù):小紅書的標(biāo)簽化主要依靠用戶手動添加標(biāo)簽和NLP關(guān)鍵詞提取相結(jié)合的方式。系統(tǒng)會根據(jù)打分模型和用戶行為特征數(shù)據(jù),實時調(diào)整推薦策略。

視頻號:話題標(biāo)簽與BPE分詞結(jié)合

視頻內(nèi)容檢測,AI會結(jié)合文本(字幕、標(biāo)題、視頻簡介)文本會結(jié)合NLP拆詞,例如“上海東方明珠”會拆成“上?!薄ⅰ皷|方明珠”兩套詞、圖像(封面),封面的特征例如人臉、衣著等均為檢測目標(biāo)、音效(背景音樂)、視頻畫面(抽幀檢測)等多模態(tài)特征進(jìn)行合規(guī)審查。

生成式AI模型應(yīng)用:如S-YOLO V5和Vision Transformer模型用于視頻內(nèi)容描述生成,結(jié)合注意力機(jī)制(Attention)增強關(guān)鍵幀識別,提升文本生成質(zhì)量。

本文由 @kingwu 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!