阿里巴巴直播防控中的實人認(rèn)證技術(shù)

3 評論 10422 瀏覽 31 收藏 10 分鐘

網(wǎng)絡(luò)直播正享受其最好的時光,隨之而來的是主播實人認(rèn)證。為此,本文將為你講解其中涉及的兩項智能技術(shù)。

直播作為近來新興的互動形態(tài),已經(jīng)成為近幾年最風(fēng)生水起的行業(yè)之一。在2016年仿佛進(jìn)入了“千團大戰(zhàn)”的繁華。歡聚時代10億砸向虎牙和ME直播,斥資1億簽下主播MISS;騰訊4億投資斗魚,后者估值10億美元;新成立的映客獲得昆侖萬維、復(fù)賽等機構(gòu)的8000萬人民幣投資;易直播獲得6000萬人民幣A輪融資;360推出花椒、秒拍推出一直播….網(wǎng)絡(luò)直播正享受其最好的時光,直播”風(fēng)口”成投資方必爭之地。

然而網(wǎng)絡(luò)直播也因為走的太快,而失去了出發(fā)的初心,主播行為、直播內(nèi)容變得不可控,低俗、大尺度、無下限成為“勁爆”欄目。針對網(wǎng)絡(luò)直播的種種怪相,12月1日,由國家網(wǎng)信辦發(fā)布的,媒體認(rèn)為“史上最嚴(yán)”的《互聯(lián)網(wǎng)直播服務(wù)管理規(guī)定》正式開始施行?!兑?guī)定》要求直播平臺按照“后臺實名、前臺自愿”的原則,對用戶進(jìn)行移動電話號碼等真實身份信息認(rèn)證。而對于網(wǎng)絡(luò)主播們,《規(guī)定》更要求通過審核身份證件等更為嚴(yán)格的方式進(jìn)行認(rèn)證登記。

而這些網(wǎng)絡(luò)直播在進(jìn)行實人認(rèn)證時,需要對包括姓名、證件號、生物屬性、手機和位置等要素進(jìn)行識別,如何在提高用戶體驗的同時準(zhǔn)確的判斷賬號背后真實的人,也是目前困擾著各大公司的一大難題。目前阿里聚安全實人認(rèn)證中使用的技術(shù)能夠大大提供自動化認(rèn)證率和審核效率。

主播實人認(rèn)證

主播的實人認(rèn)證,基于自主研發(fā)的證件OCR、人臉識別等實現(xiàn)了88%以上的自動化認(rèn)證率,并且采用云(3D、翻拍檢測等)+端(交互動作等)相結(jié)合的活體檢測技術(shù)來防御虛假認(rèn)證的風(fēng)險攻擊,以確認(rèn)主播的真實身份,降低違法風(fēng)險。

對主播進(jìn)行了嚴(yán)格的實人認(rèn)證:做到人證合一,即根據(jù)認(rèn)證過的賬號身份信息,能準(zhǔn)確找到對應(yīng)的真實的自然人。

實人認(rèn)證系統(tǒng)示意圖

其中涉及的智能技術(shù)很多,介紹其中兩項。

1、身份證OCR(光學(xué)字符識別)

身份證OCR是把身份證圖像中的文字識別為計算機能認(rèn)識的文本,自動與公安網(wǎng)等權(quán)威數(shù)據(jù)庫比對,驗證姓名、號碼等信息的真?zhèn)巍?/p>

基于自由拍攝證件圖像,流程見下圖。為保證識別率和速度,同時融合了傳統(tǒng)算法和深度學(xué)習(xí)算法。

身份證信息檢測流程圖

OCR算法對“姓名”字段的識別準(zhǔn)確率達(dá)98%以上,對“身份證號碼”和“有效期”達(dá)99.5%。 系統(tǒng)具有很強魯棒性,以下case都可以輕松識別。

OCR可以識別的身份證舉例

2、生物特征識別

只介紹人臉識別和人臉活體檢測。

人臉識別在學(xué)術(shù)界已超肉眼的識別水平,但能在實際中的大規(guī)模應(yīng)用還比較少,原因是實際場景復(fù)雜和數(shù)據(jù)缺乏。挑戰(zhàn)來自光照、姿態(tài)、翻拍、化妝、衰老以及低照片質(zhì)量。

我們對用戶真人人像、身份證照、權(quán)威數(shù)據(jù)庫的頭像進(jìn)行兩兩比對,以驗證身份的真實性。算法能在0.1%的認(rèn)假率下,使得合法用戶自動通過率達(dá)93%以上。

人臉識別包括圖像獲取、人臉檢測、活體檢測、關(guān)鍵點定位、特征提取、識別引擎等模塊。

人臉識別系統(tǒng)

2.1 人臉檢測

采用Boosting+RCNN框架。

人臉檢測結(jié)果圖

2.2 活體檢測

活體檢測是為了確保待認(rèn)證的用戶是“活人”,而不是事先拍好或翻拍的人臉照片、視頻,防止虛假認(rèn)證,降低主播的違法風(fēng)險。

活體檢測實例圖

活體檢測模塊包括:

(1)人臉檢測

檢測是否出現(xiàn)人臉,且不能是多張臉, 防止不同的人切換或人與照片的切換。

(2)3D檢測

驗證是否為立體人像,防止平面的照片或視頻攻擊。

3D檢測示意圖

(3)活體算法檢測

驗證用戶的操作是否正常,指定用戶做隨機動作(凝視、搖頭、點頭、眨眼、上下移動手機等)。

(4)連續(xù)性檢測

防止中途切換人。

(5)翻拍檢測

利用深度學(xué)習(xí)技術(shù), 區(qū)分獲取的人像是否為對屏幕、照片的翻拍。

2.3 人臉關(guān)鍵點定位

定位出眉毛、眼睛、鼻子、嘴巴等位置。主流方法有:基于參數(shù)模型的方法;基于回歸的方法;基于深度學(xué)習(xí)的方法。

我們采用基于特征的回歸方式+深度學(xué)習(xí)的方法,來訓(xùn)練關(guān)鍵點定位模型。

人臉關(guān)鍵點檢測示意圖(圖片素材來源網(wǎng)絡(luò))

2.4 特征提取

Maxout結(jié)構(gòu)示意圖

我們同時采用了傳統(tǒng)人臉特征(WLD, HOG,LBP,Gabor等)和基于深度學(xué)習(xí)(基于VGG、GoogleNet、Maxout三者的融合網(wǎng)絡(luò))的特征進(jìn)行人臉識別。

2.5 識別引擎

傳統(tǒng)人臉特征,我們采用SVM進(jìn)行pairwise距離度量;DL人臉特征,對已經(jīng)學(xué)習(xí)的分類模型進(jìn)行微調(diào)。

實人認(rèn)證自動化是基于人臉、OCR的識別結(jié)果,基于大數(shù)據(jù),綜合利用用戶的行為特征,進(jìn)行多維度信息融合,最后得到綜合決策模型,實現(xiàn)自動決策的過程。而在目前互聯(lián)網(wǎng)發(fā)展的多種業(yè)務(wù)中,實人認(rèn)證技術(shù)的應(yīng)用場景紛繁復(fù)雜,對技術(shù)指標(biāo)的要求也不盡相同,阿里聚安全提供的實人認(rèn)證技術(shù)以生物識別、無線安全技術(shù)為支撐,保障實人認(rèn)證有效性。

目前,阿里巴巴人臉識別技術(shù)已在實際場景中大規(guī)模應(yīng)用,實戰(zhàn)中相關(guān)性能指標(biāo)在FPR(False Positive Rate)0.1%情況下,TPR(True Positive Rate)達(dá)96%,識別準(zhǔn)確率遠(yuǎn)遠(yuǎn)超過人體肉眼識別。阿里聚安全實人認(rèn)證技術(shù)更以實時大數(shù)據(jù)風(fēng)險管理為核心,可實時判斷每一個用戶的認(rèn)證動機,對不同風(fēng)險等級的用戶采取不同的認(rèn)證方式,保障正常用戶能夠方便、快捷的提交資料,而風(fēng)險用戶無法簡單的通過盜用他人信息通過認(rèn)證,確保認(rèn)證的真實性。

前文回顧:阿里巴巴直播內(nèi)容風(fēng)險防控中的AI力量

 

作者:威視@阿里安全部

來源:https://zhuanlan.zhihu.com/p/24826613

本文由 @威視 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 馬云確實是中國一大驕傲

    來自河北 回復(fù)
  2. 阿里巴巴能發(fā)展這么大不無道理,做的決定和技術(shù)都非常具有前瞻性,也早早瞄準(zhǔn)了第三方登錄平臺弄了個阿里巴巴開放平臺搞接入,準(zhǔn)備和天翼開放平臺爭上一番

    來自廣東 回復(fù)
  3. 介紹很詳細(xì),這個技術(shù)以后會應(yīng)用到很多領(lǐng)域,根據(jù)工信部要求已經(jīng)強制三大運營商和42家虛擬運營商,在用戶入網(wǎng)時候必須實體檢驗了。其實早在大學(xué)時候就接觸了OCR技術(shù),那時候人臉識別只有在美國的電影上看到過,我也算是這個技術(shù)的踐行者吧!

    來自北京 回復(fù)