用“斗渣男”的方法,與低質(zhì)內(nèi)容做斗爭

1 評論 3185 瀏覽 13 收藏 14 分鐘

編輯導(dǎo)讀:對于內(nèi)容產(chǎn)品來說,內(nèi)容審核是必不可少的環(huán)節(jié)之一,特別是針對低質(zhì)內(nèi)容的篩選和刪改更是勞心勞神。如何快速有效識別低質(zhì)內(nèi)容,營造平臺良好生態(tài)?本文作者以“斗渣男”的例子,對此展開了分析說明,一起來看看~

直擊靈魂一問:你遇到過渣男嗎?

直擊靈魂二問:你被渣過嗎?

直擊靈魂三問:你被渣過后,怎樣反擊?

要是沒有,這篇文章就到這兒結(jié)束了?

不!結(jié)束不了!

現(xiàn)在沒遇到,可以看看渣男的套路,防患于未然。

反渣男套路四部曲:

  • 第一步:發(fā)現(xiàn)—透過蛛絲馬跡,發(fā)現(xiàn)存疑跡象
  • 第二步:分析—尋找證據(jù),證明他的身份
  • 第三步:識別—利用確鑿證據(jù),坐實渣男身份
  • 第四步:反擊—多種手段齊上陣,絕地反擊

凈化生態(tài),打擊低質(zhì)內(nèi)容,同樣適用四部曲:

  • 第一步:發(fā)現(xiàn)—透過蛛絲馬跡,發(fā)現(xiàn)疑似低質(zhì)
  • 第二步:分析—尋找證據(jù),證明它是低質(zhì)內(nèi)容
  • 第三步:識別—利用模型、人工,精準(zhǔn)識別低質(zhì)
  • 第四步:反擊—降權(quán)、過濾等手段齊上陣,絕地反擊

一、透過蛛絲馬跡,尋找證據(jù),揪住低質(zhì)內(nèi)容

我們都知道,世上渣男千千萬,普遍性中都帶有獨(dú)特性,先來看看常見的有哪些?那些不常見的,可以通過什么方法來發(fā)現(xiàn)?

最常見的就是徒有外表,沒有內(nèi)涵,利用精致外表來迷惑人心,讓你放下戒備,徹底淪陷。

另外就是花言巧語,利用人性的弱點(diǎn),讓你放下戒備,徹底淪陷。

看到這里,也許你會反問!

  • 只要外表光鮮,就是渣男嗎?
  • 只要花言巧語,就是渣男嗎?
  • ……

其實不然,這些只是列舉的存疑跡象,當(dāng)出現(xiàn)這些跡象后,我們需要小心啦,進(jìn)一步搜集證據(jù),進(jìn)行綜合分析。

  1. 試探他對你的各種表達(dá),是否忽冷忽熱?是否行為異常?
  2. 看他是否向你坦白過往的歷史,日常所做的事,是否有所隱瞞?
  3. 看他是否會把你介紹他的朋友,是否允許你進(jìn)入他的世界,承認(rèn)你的存在?
  4. 走訪他的周邊朋友,聽最“真實的反饋”

當(dāng)然,要是有最直接的證據(jù),就不用費(fèi)力去做這些了。

比如《三十而已》中,顧佳似乎已經(jīng)通過許幻山的異常行為發(fā)現(xiàn)了端倪,始終沒有直接證據(jù)。直到通過林有有身上的飾品,以及閨蜜拍的照片等直接證據(jù),才坐實了許幻山出軌的事實。

……

當(dāng)把這些渣男特征投射到內(nèi)容上,分別對應(yīng)著標(biāo)題黨與低俗色情內(nèi)容等,這類內(nèi)容利用各類吸引眼球的關(guān)鍵字,夸大其詞,刺激用戶點(diǎn)擊欲望。利用人性的弱點(diǎn),刺激荷爾蒙分泌,刺激用戶點(diǎn)擊的欲望。

低質(zhì)內(nèi)容特征除了這些之外,還有很多很多,隨著自媒體的發(fā)展,自媒體創(chuàng)作者發(fā)揮著無窮無盡的“聰明才智”獲取流量。

對于可枚舉低質(zhì)內(nèi)容,按照不同內(nèi)容體裁可有以下枚舉值:

對于不可枚舉低質(zhì)內(nèi)容,沒法通過模型或者人工立馬將其干掉,但可通過一些蛛絲馬跡,將其揪出重點(diǎn)監(jiān)控與分析。

1. 用戶反饋-最真實的聲音

內(nèi)容類產(chǎn)品都有設(shè)置用戶反饋渠道,除了固定反饋選項,用戶也可主動填寫意見建議,那么應(yīng)該怎樣用好這些資源?

A)搭建數(shù)據(jù)監(jiān)控報表,針對每一類負(fù)反饋選項,整體負(fù)反饋投訴等,監(jiān)測小時級、天級的用戶反饋趨勢變化,定期進(jìn)行分析。建立報警機(jī)制,當(dāng)某類投訴超出一定閾值(比如xx小時內(nèi)投訴內(nèi)容猛增xxx+),發(fā)出報警信息,重點(diǎn)排查監(jiān)控。

B)定期分析用戶主動填寫的意見反饋,除了人工一條條查閱總結(jié),也可通過python切詞進(jìn)行詞頻分析,統(tǒng)計用戶負(fù)向反饋集中于哪些方向。筆者拉出了所在公司一定時間周期內(nèi)用戶負(fù)反饋數(shù)據(jù),用python切詞處理得到如下結(jié)果:

通過詞頻統(tǒng)計發(fā)現(xiàn),用戶反饋比較高頻的詞語基本沒什么實際意義,但也不乏“胡說八道”“廢話”等反應(yīng)用戶情緒的詞語,再聯(lián)系情景語境與被反饋的文章內(nèi)容,也可總結(jié)出一批低質(zhì)內(nèi)容特征(慢工出細(xì)活,這里需要很強(qiáng)的總結(jié)歸納能力)。

附上python切詞代碼,墻裂推薦超好用的一款工具-VS code。

import jieba

txt=open(“d:\負(fù)反饋內(nèi)容.txt”,”r”,encoding=’utf-8′).read()

words=jieba.lcut(txt)

counts={}

forwordinwords:

iflen(word)==1:

continue

else:

counts[word]=counts.get(word,0)+1

items=list(counts.items())

items.sort(key=lambdax:x[1],reverse=True)

foriinrange(1000):

word,count=items[i]

print(“{0:<5}{1:>5}”.format(word,count))

2. 審核當(dāng)好把門關(guān)

隨著自媒體時代到來,人人都是發(fā)聲者,每日海量內(nèi)容涌入各大平臺,內(nèi)容安全變得越來越重要。機(jī)器模型無法做到100%準(zhǔn)確識別,人工的力量變的愈發(fā)重要。

眾所周知,審核同學(xué)會在審核時為內(nèi)容打標(biāo)(主要針對既有的枚舉低質(zhì)內(nèi)容標(biāo)簽),業(yè)界常規(guī)做法是利用機(jī)器模型輔助人審,提升審核效率。

無法枚舉的低質(zhì)內(nèi)容,該怎樣發(fā)現(xiàn),監(jiān)控爆發(fā)增長趨勢?

此刻,搭建一套監(jiān)控機(jī)制體系顯得尤為重要!

第一步:審核工具增加“疑似低質(zhì)”tag選項,標(biāo)識沒有被既有低質(zhì)標(biāo)簽覆蓋的內(nèi)容。

注意點(diǎn):加強(qiáng)審核人員培訓(xùn),包括內(nèi)容審核標(biāo)準(zhǔn)培訓(xùn)(了解實際工作,提升專業(yè)能力)、業(yè)務(wù)培訓(xùn)(拓展知識邊界,加深業(yè)務(wù)理解)等,只有審核同學(xué)更了解業(yè)務(wù),才能在審核打標(biāo)時理解更透徹。

第二步:建立監(jiān)控報表,針對每一類既有低質(zhì)內(nèi)容,疑似低質(zhì)內(nèi)容等,監(jiān)測這些標(biāo)簽內(nèi)容在不同類目、不同時段的數(shù)量變化趨勢,對于一定周期內(nèi)爆發(fā)式增長、某個類目爆發(fā)式增長的低質(zhì)內(nèi)容,重點(diǎn)監(jiān)控與排查分析。

第三步:定期分析疑似低質(zhì)內(nèi)容,從中總結(jié)歸納新的低質(zhì)內(nèi)容,建立模型標(biāo)準(zhǔn),推進(jìn)樣本標(biāo)注與模型訓(xùn)練,輸出滿足上線要求的內(nèi)容質(zhì)量模型,輔助人審或者應(yīng)用線上。

二、精準(zhǔn)識別低質(zhì)內(nèi)容,絕地反擊

我們透過蛛絲馬跡,發(fā)現(xiàn)了渣男的可疑跡象,通過各種方法搜集到證據(jù),怎樣讓他現(xiàn)出原形?

  • 當(dāng)面對質(zhì)
  • 將他說的假話念給他聽
  • 將隱瞞的種種事實說給他聽
  • 將朋友的真實反饋說給他聽
  • 將最直接的證據(jù)扔他臉上
  • ……

如果

渣男,鑒定無疑,怎么處理?

當(dāng)然,一腳把它踢開呀!

那么,通過模型、人審精準(zhǔn)識別的低質(zhì)內(nèi)容,應(yīng)該怎樣處理?

想要回答這個問題,首先我們來看看推薦系統(tǒng)怎樣運(yùn)轉(zhuǎn)。

推薦系統(tǒng)大致分為5個環(huán)節(jié):推薦內(nèi)容候選池(正排)→召回→粗排→精排→機(jī)制策略

  1. 推薦內(nèi)容候選池:從內(nèi)容庫中通過一定過濾條件,篩選可用內(nèi)容。
  2. 召回:從推薦內(nèi)容候選池中,通過一定規(guī)則(內(nèi)容特征特征、模型、功能等)找到對應(yīng)內(nèi)容。
  3. 粗排:針對各路召回內(nèi)容,利用用戶特征、內(nèi)容特征、環(huán)境特征、交叉特征等進(jìn)行粗粒度排序。
  4. 精排:再次利用精細(xì)化特征信息,利用cyr預(yù)估等模型,為內(nèi)容打分排序,產(chǎn)生一個用戶的待推薦內(nèi)容列表。
  5. 機(jī)制策略:使用各種機(jī)制策略(打散、去重、提權(quán)、過濾等)得到用戶最終推薦內(nèi)容列表。

由此來看,處理低質(zhì)內(nèi)容可作用于召回、機(jī)制策略等環(huán)節(jié)。

1. 作用于召回-召回過濾

適用范圍:嚴(yán)重影響用戶閱讀體驗的強(qiáng)低質(zhì)內(nèi)容,比如視頻無聲音、模糊、音畫不同步等。

實現(xiàn)形式:直接將命中的tag內(nèi)容過濾掉,不會進(jìn)入排序環(huán)節(jié)。

2. 作用于機(jī)制策略-推薦降權(quán)

適用范圍:不嚴(yán)重影響用戶閱讀體驗,比如標(biāo)題黨、低俗等內(nèi)容。

實現(xiàn)形式:

1)機(jī)制策略側(cè)加上降權(quán)邏輯,降低此類內(nèi)容在推薦列表排序,從而減小曝光量。

注意點(diǎn):對于標(biāo)題黨、低俗等內(nèi)容打壓,勢必會對大盤數(shù)據(jù)造成影響,因此需要AB實驗驗證打壓策略的實際效果。

  1. AB實驗隨機(jī)分桶,進(jìn)行小流量實驗
  2. 關(guān)注核心數(shù)據(jù)指標(biāo):人均人均點(diǎn)擊、人均閱讀時長、次日留存、3日留存等。
  3. 若實驗收益負(fù)向,觀察核心指標(biāo)浮動區(qū)間是否穩(wěn)定,找到平衡點(diǎn),再上報領(lǐng)導(dǎo)層,對于實驗的負(fù)向收益區(qū)間是否可接受。若可接受,可分階段擴(kuò)大流量上線。若不可接受,需要調(diào)整策略(建立低質(zhì)內(nèi)容分檔分級,由嚴(yán)重到一般分級打壓,給用戶適應(yīng)周期)。

2)搭建一套生態(tài)凈化平臺工具,靈活管控內(nèi)容生態(tài)

生態(tài)凈化工具可大致分為三個模塊:模型內(nèi)容特征參數(shù)配置→凈化過濾任務(wù)配置→生效范圍配置

  1. 模型內(nèi)容特征參數(shù)配置:可實現(xiàn)對不同模型內(nèi)容特征設(shè)定閾值,卡檔分級,根據(jù)模型迭代優(yōu)化效果,靈活調(diào)整參數(shù)配置??芍С蛛S時增添新模型內(nèi)容特征配置。
  2. 凈化過濾任務(wù)配置:針對圖文/視頻/小視頻等不同體裁分別配置過濾任務(wù),可從一二級分類、標(biāo)題關(guān)鍵字、內(nèi)容屬性特征(模型特征+人審標(biāo)簽)等維度進(jìn)行配置??芍С蛛S時添加新模型特征與人審標(biāo)簽。
  3. 生效范圍配置:針對配置好的凈化過濾任務(wù),再次配置生效范圍,可從用戶性別與年齡,地域、手機(jī)型號與系統(tǒng)、bucket(流量分桶)等進(jìn)行生效用戶圈定??芍С蛛S時添加新的特征字段。

通過生態(tài)凈化工具,靈活管控,在重大節(jié)日、特殊時期等節(jié)點(diǎn),可實現(xiàn)快速、靈活響應(yīng)。

渣男千千萬,永遠(yuǎn)斗不完。

低質(zhì)內(nèi)容萬萬種,永遠(yuǎn)打不完。

對待渣男,要擦亮雙眼,不要沉迷!

對待低質(zhì)內(nèi)容,要擦亮雙眼,不放過一個!

這場戰(zhàn)役,將是場持久戰(zhàn)!

 

本文由 @珂然 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 確實是個持久戰(zhàn),敵進(jìn)我退,敵駐我擾,敵疲我打,敵退我追。

    回復(fù)