久久久日韩精品一区二区三区 ,国产一线二线三线女

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

用“斗渣男”的方法，與低質(zhì)內(nèi)容做斗爭

珂然

2020-09-22

1 評論 3185 瀏覽 13 收藏

14 分鐘

編輯導(dǎo)讀：對于內(nèi)容產(chǎn)品來說，內(nèi)容審核是必不可少的環(huán)節(jié)之一，特別是針對低質(zhì)內(nèi)容的篩選和刪改更是勞心勞神。如何快速有效識別低質(zhì)內(nèi)容，營造平臺良好生態(tài)？本文作者以“斗渣男”的例子，對此展開了分析說明，一起來看看~

直擊靈魂一問：你遇到過渣男嗎？

直擊靈魂二問：你被渣過嗎？

直擊靈魂三問：你被渣過后，怎樣反擊？

要是沒有，這篇文章就到這兒結(jié)束了？

不！結(jié)束不了！

現(xiàn)在沒遇到，可以看看渣男的套路，防患于未然。

反渣男套路四部曲：

第一步：發(fā)現(xiàn)—透過蛛絲馬跡，發(fā)現(xiàn)存疑跡象
第二步：分析—尋找證據(jù)，證明他的身份
第三步：識別—利用確鑿證據(jù)，坐實渣男身份
第四步：反擊—多種手段齊上陣，絕地反擊

凈化生態(tài)，打擊低質(zhì)內(nèi)容，同樣適用四部曲：

第一步：發(fā)現(xiàn)—透過蛛絲馬跡，發(fā)現(xiàn)疑似低質(zhì)
第二步：分析—尋找證據(jù)，證明它是低質(zhì)內(nèi)容
第三步：識別—利用模型、人工，精準(zhǔn)識別低質(zhì)
第四步：反擊—降權(quán)、過濾等手段齊上陣，絕地反擊

一、透過蛛絲馬跡，尋找證據(jù)，揪住低質(zhì)內(nèi)容

我們都知道，世上渣男千千萬，普遍性中都帶有獨(dú)特性，先來看看常見的有哪些？那些不常見的，可以通過什么方法來發(fā)現(xiàn)？

最常見的就是徒有外表，沒有內(nèi)涵，利用精致外表來迷惑人心，讓你放下戒備，徹底淪陷。

另外就是花言巧語，利用人性的弱點(diǎn)，讓你放下戒備，徹底淪陷。

看到這里，也許你會反問！

只要外表光鮮，就是渣男嗎？
只要花言巧語，就是渣男嗎？
……

其實不然，這些只是列舉的存疑跡象，當(dāng)出現(xiàn)這些跡象后，我們需要小心啦，進(jìn)一步搜集證據(jù)，進(jìn)行綜合分析。

試探他對你的各種表達(dá)，是否忽冷忽熱？是否行為異常？
看他是否向你坦白過往的歷史，日常所做的事，是否有所隱瞞？
看他是否會把你介紹他的朋友，是否允許你進(jìn)入他的世界，承認(rèn)你的存在？
走訪他的周邊朋友，聽最“真實的反饋”

當(dāng)然，要是有最直接的證據(jù)，就不用費(fèi)力去做這些了。

比如《三十而已》中，顧佳似乎已經(jīng)通過許幻山的異常行為發(fā)現(xiàn)了端倪，始終沒有直接證據(jù)。直到通過林有有身上的飾品，以及閨蜜拍的照片等直接證據(jù)，才坐實了許幻山出軌的事實。

……

當(dāng)把這些渣男特征投射到內(nèi)容上，分別對應(yīng)著標(biāo)題黨與低俗色情內(nèi)容等，這類內(nèi)容利用各類吸引眼球的關(guān)鍵字，夸大其詞，刺激用戶點(diǎn)擊欲望。利用人性的弱點(diǎn)，刺激荷爾蒙分泌，刺激用戶點(diǎn)擊的欲望。

低質(zhì)內(nèi)容特征除了這些之外，還有很多很多，隨著自媒體的發(fā)展，自媒體創(chuàng)作者發(fā)揮著無窮無盡的“聰明才智”獲取流量。

對于可枚舉低質(zhì)內(nèi)容，按照不同內(nèi)容體裁可有以下枚舉值：

對于不可枚舉低質(zhì)內(nèi)容，沒法通過模型或者人工立馬將其干掉，但可通過一些蛛絲馬跡，將其揪出重點(diǎn)監(jiān)控與分析。

1. 用戶反饋-最真實的聲音

內(nèi)容類產(chǎn)品都有設(shè)置用戶反饋渠道，除了固定反饋選項，用戶也可主動填寫意見建議，那么應(yīng)該怎樣用好這些資源？

A）搭建數(shù)據(jù)監(jiān)控報表，針對每一類負(fù)反饋選項，整體負(fù)反饋投訴等，監(jiān)測小時級、天級的用戶反饋趨勢變化，定期進(jìn)行分析。建立報警機(jī)制，當(dāng)某類投訴超出一定閾值（比如xx小時內(nèi)投訴內(nèi)容猛增xxx+）,發(fā)出報警信息，重點(diǎn)排查監(jiān)控。

B）定期分析用戶主動填寫的意見反饋，除了人工一條條查閱總結(jié)，也可通過python切詞進(jìn)行詞頻分析，統(tǒng)計用戶負(fù)向反饋集中于哪些方向。筆者拉出了所在公司一定時間周期內(nèi)用戶負(fù)反饋數(shù)據(jù)，用python切詞處理得到如下結(jié)果：

通過詞頻統(tǒng)計發(fā)現(xiàn)，用戶反饋比較高頻的詞語基本沒什么實際意義，但也不乏“胡說八道”“廢話”等反應(yīng)用戶情緒的詞語，再聯(lián)系情景語境與被反饋的文章內(nèi)容，也可總結(jié)出一批低質(zhì)內(nèi)容特征（慢工出細(xì)活，這里需要很強(qiáng)的總結(jié)歸納能力）。

附上python切詞代碼，墻裂推薦超好用的一款工具-VS code。

import jieba

txt=open(“d:\負(fù)反饋內(nèi)容.txt”,”r”,encoding=’utf-8′).read()

words=jieba.lcut(txt)

counts={}

forwordinwords:

iflen(word)==1:

continue

else:

counts[word]=counts.get(word,0)+1

items=list(counts.items())

items.sort(key=lambdax:x[1],reverse=True)

foriinrange(1000):

word,count=items[i]

print(“{0:<5}{1:>5}”.format(word,count))

2. 審核當(dāng)好把門關(guān)

隨著自媒體時代到來，人人都是發(fā)聲者，每日海量內(nèi)容涌入各大平臺，內(nèi)容安全變得越來越重要。機(jī)器模型無法做到100%準(zhǔn)確識別，人工的力量變的愈發(fā)重要。

眾所周知，審核同學(xué)會在審核時為內(nèi)容打標(biāo)（主要針對既有的枚舉低質(zhì)內(nèi)容標(biāo)簽），業(yè)界常規(guī)做法是利用機(jī)器模型輔助人審，提升審核效率。

無法枚舉的低質(zhì)內(nèi)容，該怎樣發(fā)現(xiàn)，監(jiān)控爆發(fā)增長趨勢？

此刻，搭建一套監(jiān)控機(jī)制體系顯得尤為重要！

第一步：審核工具增加“疑似低質(zhì)”tag選項，標(biāo)識沒有被既有低質(zhì)標(biāo)簽覆蓋的內(nèi)容。

注意點(diǎn)：加強(qiáng)審核人員培訓(xùn)，包括內(nèi)容審核標(biāo)準(zhǔn)培訓(xùn)（了解實際工作，提升專業(yè)能力）、業(yè)務(wù)培訓(xùn)（拓展知識邊界，加深業(yè)務(wù)理解）等，只有審核同學(xué)更了解業(yè)務(wù)，才能在審核打標(biāo)時理解更透徹。

第二步：建立監(jiān)控報表，針對每一類既有低質(zhì)內(nèi)容，疑似低質(zhì)內(nèi)容等，監(jiān)測這些標(biāo)簽內(nèi)容在不同類目、不同時段的數(shù)量變化趨勢，對于一定周期內(nèi)爆發(fā)式增長、某個類目爆發(fā)式增長的低質(zhì)內(nèi)容，重點(diǎn)監(jiān)控與排查分析。

第三步：定期分析疑似低質(zhì)內(nèi)容，從中總結(jié)歸納新的低質(zhì)內(nèi)容，建立模型標(biāo)準(zhǔn)，推進(jìn)樣本標(biāo)注與模型訓(xùn)練，輸出滿足上線要求的內(nèi)容質(zhì)量模型，輔助人審或者應(yīng)用線上。

二、精準(zhǔn)識別低質(zhì)內(nèi)容，絕地反擊

我們透過蛛絲馬跡，發(fā)現(xiàn)了渣男的可疑跡象，通過各種方法搜集到證據(jù)，怎樣讓他現(xiàn)出原形？

當(dāng)面對質(zhì)
將他說的假話念給他聽
將隱瞞的種種事實說給他聽
將朋友的真實反饋說給他聽
將最直接的證據(jù)扔他臉上
……

如果

渣男，鑒定無疑，怎么處理？

當(dāng)然，一腳把它踢開呀！

那么，通過模型、人審精準(zhǔn)識別的低質(zhì)內(nèi)容，應(yīng)該怎樣處理？

想要回答這個問題，首先我們來看看推薦系統(tǒng)怎樣運(yùn)轉(zhuǎn)。

推薦系統(tǒng)大致分為5個環(huán)節(jié)：推薦內(nèi)容候選池（正排）→召回→粗排→精排→機(jī)制策略

推薦內(nèi)容候選池：從內(nèi)容庫中通過一定過濾條件，篩選可用內(nèi)容。
召回：從推薦內(nèi)容候選池中，通過一定規(guī)則（內(nèi)容特征特征、模型、功能等）找到對應(yīng)內(nèi)容。
粗排：針對各路召回內(nèi)容，利用用戶特征、內(nèi)容特征、環(huán)境特征、交叉特征等進(jìn)行粗粒度排序。
精排：再次利用精細(xì)化特征信息，利用cyr預(yù)估等模型，為內(nèi)容打分排序，產(chǎn)生一個用戶的待推薦內(nèi)容列表。
機(jī)制策略：使用各種機(jī)制策略（打散、去重、提權(quán)、過濾等）得到用戶最終推薦內(nèi)容列表。

由此來看，處理低質(zhì)內(nèi)容可作用于召回、機(jī)制策略等環(huán)節(jié)。

1. 作用于召回-召回過濾

適用范圍：嚴(yán)重影響用戶閱讀體驗的強(qiáng)低質(zhì)內(nèi)容，比如視頻無聲音、模糊、音畫不同步等。

實現(xiàn)形式：直接將命中的tag內(nèi)容過濾掉，不會進(jìn)入排序環(huán)節(jié)。

2. 作用于機(jī)制策略-推薦降權(quán)

適用范圍：不嚴(yán)重影響用戶閱讀體驗，比如標(biāo)題黨、低俗等內(nèi)容。

實現(xiàn)形式：

1）機(jī)制策略側(cè)加上降權(quán)邏輯，降低此類內(nèi)容在推薦列表排序，從而減小曝光量。

注意點(diǎn)：對于標(biāo)題黨、低俗等內(nèi)容打壓，勢必會對大盤數(shù)據(jù)造成影響，因此需要AB實驗驗證打壓策略的實際效果。

AB實驗隨機(jī)分桶，進(jìn)行小流量實驗
關(guān)注核心數(shù)據(jù)指標(biāo)：人均人均點(diǎn)擊、人均閱讀時長、次日留存、3日留存等。
若實驗收益負(fù)向，觀察核心指標(biāo)浮動區(qū)間是否穩(wěn)定，找到平衡點(diǎn)，再上報領(lǐng)導(dǎo)層，對于實驗的負(fù)向收益區(qū)間是否可接受。若可接受，可分階段擴(kuò)大流量上線。若不可接受，需要調(diào)整策略（建立低質(zhì)內(nèi)容分檔分級，由嚴(yán)重到一般分級打壓，給用戶適應(yīng)周期）。

2）搭建一套生態(tài)凈化平臺工具，靈活管控內(nèi)容生態(tài)

生態(tài)凈化工具可大致分為三個模塊：模型內(nèi)容特征參數(shù)配置→凈化過濾任務(wù)配置→生效范圍配置

模型內(nèi)容特征參數(shù)配置：可實現(xiàn)對不同模型內(nèi)容特征設(shè)定閾值，卡檔分級，根據(jù)模型迭代優(yōu)化效果，靈活調(diào)整參數(shù)配置?？芍С蛛S時增添新模型內(nèi)容特征配置。
凈化過濾任務(wù)配置：針對圖文/視頻/小視頻等不同體裁分別配置過濾任務(wù)，可從一二級分類、標(biāo)題關(guān)鍵字、內(nèi)容屬性特征（模型特征+人審標(biāo)簽）等維度進(jìn)行配置?？芍С蛛S時添加新模型特征與人審標(biāo)簽。
生效范圍配置：針對配置好的凈化過濾任務(wù)，再次配置生效范圍，可從用戶性別與年齡，地域、手機(jī)型號與系統(tǒng)、bucket（流量分桶）等進(jìn)行生效用戶圈定?？芍С蛛S時添加新的特征字段。