揭秘今日頭條「網路安全委員會」，人工智慧如何讓網路更安全

科技 06-02

圖片來源：東方IC

我國首部規範互聯網信息環境的基礎法規《網路安全法》在6月1日之後正式實施。

該法實施前，各大互聯網巨頭就紛紛加碼信息安全及內容自查等方面的投入，阿里和騰訊分別通過各自的雲服務輸出其安全技術介面，或強制推行實名制。百度先後發布公告實行百度賬號實名制、百度網盤自6月1日起也要求實名制，百度在安全方面，早就推出了大數據平台4A安全體系；以個人安全業務起家的360也有完善的大數據安全平台。

在新法實施同一天，今日頭條宣布成立「網路安全委員會」。

鈦媒體獲悉，該委員會是一個獨立組織，由技術、運營、審核多部門的核心人才共同參與，從註冊實名制、社區自律以及審核等方面，保障用戶安全和內容。

不生產內容、專註於內容分發的今日頭條，躋身國內內容分發平台第一陣營，尤其是在2015年9月這家公司推出頭條號以來，頭條號的數量迅速增長，從用戶規模到內容體量，這都要求在平台運營規則上進一步規範化。

對於內容分發平台而言，網路安全最主要的議題是內容安全。以坐擁上億用戶的微信公眾平台就曾在產品上經歷過無數次迭代，在內容過濾、賬號封禁、用戶舉報機制上做足了功夫。今日頭條抽調了 20 餘人的技術團隊，專門匹配給網路安全委員會，顯然，在網路安全建設方面依然是一個技術升級的信仰者。

近日，今日頭條首度向鈦媒體透露了其在網路安全和內容審核上的獨家「法寶」。作為「幕後英雄」的網路安全委員會，到底是如何運作的？演算法模型、人工智慧，到底是怎麼幫助人工完成安全審核？

一、實名制升級：接入face++識別技術

有自媒體從業者曾向鈦媒體證實，頭條號開放平台的註冊極為嚴格。在賬號註冊上，按照相關政策要求用戶註冊必須綁定手機，而且堅持人工審核。

2017年，新成立的網路安全委員會對實名制進行了一次技術升級，即通過AI技術對註冊用戶進行身份實名認證，這項識別服務採用了曠視科技（face++）提供的人臉識別、活體檢測技術，來判斷每一位實名用戶各項信息的匹配程度。

鈦媒體記者在今年3月份頭條號發布的一則「嚴厲打擊發布不實負面信息的公告」中看到（如下圖），一共20個頭條號遭遇禁言處罰，並有3名頭條號運營者被封禁。

註冊頭條號的用戶，首先都將要求閱讀並接受一份《頭條號管理制度》，於頭條號名稱規範、簡介規範、審核標準、處罰標準等都做出了明確規定。

由於每個身份證僅限註冊一個頭條號，與其他平台相比，頭條號的審核規則是最嚴格的。一旦因運營者違規操作被平台封禁賬號，「被封禁賬號的身份證也不予釋放」，這也意味著，嚴重的違規操作者可能面臨永久加入「黑名單」的風險。

二、審核機制：如何「幹掉」虛假信息

在內容審核方面，各大內容型平枱曆來都是高成本、高投入，內容把關的技術能力，對於內容型平台來說更是一條生死線。鈦媒體對國內某第一陣營直播平台的採訪中發現，內容運營的人力成本、技術和設備採購成本加在一起，一個典型的內容型平台在內容自查上的投入要超過一個億人民幣。

低俗、謠言、標題黨——堪稱國內外各個內容平台的三大毒瘤。

針對於此，今日頭條在內容審核上採取了一套獨家的「四審機制」，也就是說，在今日頭條的內容審核流程中，文章100%過人工審核，通過「人防」和」技防「的結合，所有文章通過技術過濾、人工審核、盲審、複審的「四審機制」才能發布。

「盲審」環節，充分體現了機器+人工審核的優勢：機器根據規則和比例抽取文章，將同一篇文章同時分配給兩位審核員，如果兩人判斷一致則通過，判斷不一致會再分配給第三個人進行把關，通過這種模式最大程度降低了因審核員主觀原因、個人問題造成的誤放、漏放。

那麼，最為頭疼而且隱蔽的標題黨，又是怎樣攔截的呢？今日頭條技術負責人向鈦媒體介紹，「標題黨可以通過人工+機器三層攔截，進行識別。」

今日頭條研發團隊建立的數據模型，目前可以準確識別出「標題黨」的內容。一篇完整的文章進入平台機器經識別和處理，最終從「機器」流程中放出來，今日頭條的技術負責人向鈦媒體還原出了一個完整的識別過程：

當平台識別出標題黨的關鍵詞後，「發送彈窗」的方式提示並勸導作者打住這樣的行為；通過模型識別而來的標題黨，平台將召回並人工確認；最後一道工序交給人工——人工複審將對從各種渠道召回的文章進行最終的人工評估複審。

今日頭條還首度向鈦媒體披露了這樣一個數據：截止2016年底，演算法模型對「頭條號」低質、低俗內容的識別準確率提高到80%，並可將頭條號平台上超過90%的低俗內容識別出來。

對於擁有龐大用戶的內容平台來說，提高自律能力也是最大限度提高「審核」效率的途徑。今日頭條也設置了完善的舉報功能，在今日頭條，有一部專人守候的舉報電話7×24無間隙工作，同時設置了電話、郵箱、APP、PC等不同類型的舉報埠。

為了防止虛假信息擾亂經濟秩序和社會秩序，今日頭條還利用人工智慧技術，讓機器結合用戶舉報和跟帖評論，甄別虛假信息。此外，今日頭條還推出精準闢謠功能，如果用戶閱讀過的內容被證實為謠言，系統將第一時間向所有看過該文的用戶推送相應闢謠文章。

三、輔助人工的技術「外腦」

資訊分發平台在內容傳播上的最大困擾，是「舊聞新編」、「虛假信息」的受害者不計其數，文字識別技術是這類垃圾信息的第一道屏障，文字、圖片、視頻乃至廣告，一旦不符合內容質量和內容安全的要求，即便騙得過人眼，也很難騙得過機器。

據悉，今日頭條的文字識別技術，還可以識別出用戶評論的內容，並且將其派給人工處理。

隨著短視頻內容的爆發，視頻內容審核成為「委員會」的重點項目之一，針對於此，今日頭條祭出了動態關鍵幀技術、圖像建模識別技術和OCR識別技術三大殺手鐧。

動態關鍵幀技術，利用視頻場景變換關鍵幀檢測視頻運動變化情況，並抽取出發生場景變化的關鍵幀，提供給審核員進行審核。即便是潛伏在視頻中的低俗內容、反動內容及廣告，也能被甄別出來

圖像建模識別，則在色情低俗圖像識別上最好用。這種基於深度學習的圖片識別技術，可以模仿人腦機制，讓機器自動學習圖片的特徵。最終建立的圖片模型，能對每張圖片和視頻動態幀截圖進行低俗識別。

OCR識別技術，則能通過機器自動提取出附在圖片上的文字，確保低俗有害文字不能通過圖片變相傳播。

在目前看來，這些技術的運營已經取得了一定的效果。數據顯示，過去一年，平台上共標註圖片樣本110萬，低俗視頻樣本1萬，攔截率較之前人工攔截提升了73.71%。

網路安全法的出台，在中國互聯網發展史上具有標誌性意義。和今日頭條一樣，中國的互聯網巨頭們責任重大，不過，各家平台想要共同凈化網路、維護安全生態的意願，根本上還需要足夠強大的技術能力來支撐。

（本文首發鈦媒體）

點擊展開全文

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 TechWeb 的精彩文章:

※Box CEO通過貝佐斯汲取靈感為來年的公司做準備
※三星首款雙攝手機渲染圖曝光：6GB RAM+驍龍660
※8GB大內存+變焦雙攝！努比亞發布Z17無邊框防水手機
※菜鳥順豐各說各的理就行為什麼要把阿里雲和騰訊雲扯進來
※OPPO官方公布新代言人竟然是周杰倫！

TAG:TechWeb |

您可能感興趣

※王世偉：論信息安全、網路安全、網路空間安全
※你的網路安全嗎？
※歐盟網路安全法案：建通用網路安全認證系統
※首都網路安全日參展安全廠商巡禮
※「凈網行動」：孟連縣公安局召開全縣網站及重要信息系統網路安全檢查工作會議
※網路安全創投風向何方新時代的網路安全——網路安全創投高峰論壇
※關於網路個人隱私安全，周鴻禕委員有話說
※物聯網即將全面改變網路安全
※人工智慧如何重新定義網路安全？
※為信息安全加把鎖《網路安全法》為互聯網保駕護航！
※網路安全與人工智慧的演進
※譚曉生：大安全時代如何保障國家網路空間安全
※關於個人信息安全和網路安全的萬能答案
※無「網路中立」的時代，我們該如何保證網路安全
※網路安全那些事兒
※DNS安全為何是網路安全的核心？
※鄔賀銓：從網路安全到數據安全
※哈爾濱中軟分享：物聯網即將全面改變網路安全
※人工智慧之於維護網路安全是一把雙刃劍
※深信服：網路信息安全龍頭