當前位置:
首頁 > 科技 > 揭秘今日頭條「網路安全委員會」,人工智慧如何讓網路更安全

揭秘今日頭條「網路安全委員會」,人工智慧如何讓網路更安全

圖片來源:東方IC

我國首部規範互聯網信息環境的基礎法規《網路安全法》在6月1日之後正式實施。

該法實施前,各大互聯網巨頭就紛紛加碼信息安全及內容自查等方面的投入,阿里和騰訊分別通過各自的雲服務輸出其安全技術介面,或強制推行實名制。百度先後發布公告實行百度賬號實名制、百度網盤自6月1日起也要求實名制,百度在安全方面,早就推出了大數據平台4A安全體系;以個人安全業務起家的360也有完善的大數據安全平台。

在新法實施同一天,今日頭條宣布成立「網路安全委員會」。

鈦媒體獲悉,該委員會是一個獨立組織,由技術、運營、審核多部門的核心人才共同參與,從註冊實名制、社區自律以及審核等方面,保障用戶安全和內容。

不生產內容、專註於內容分發的今日頭條,躋身國內內容分發平台第一陣營,尤其是在2015年9月這家公司推出頭條號以來,頭條號的數量迅速增長,從用戶規模到內容體量,這都要求在平台運營規則上進一步規範化。

對於內容分發平台而言,網路安全最主要的議題是內容安全。以坐擁上億用戶的微信公眾平台就曾在產品上經歷過無數次迭代,在內容過濾、賬號封禁、用戶舉報機制上做足了功夫。今日頭條抽調了 20 餘人的技術團隊,專門匹配給網路安全委員會,顯然,在網路安全建設方面依然是一個技術升級的信仰者。

近日,今日頭條首度向鈦媒體透露了其在網路安全和內容審核上的獨家「法寶」。作為「幕後英雄」的網路安全委員會,到底是如何運作的?演算法模型、人工智慧,到底是怎麼幫助人工完成安全審核?

一、實名制升級:接入face++識別技術

有自媒體從業者曾向鈦媒體證實,頭條號開放平台的註冊極為嚴格。在賬號註冊上,按照相關政策要求用戶註冊必須綁定手機,而且堅持人工審核。

2017年,新成立的網路安全委員會對實名制進行了一次技術升級,即通過AI技術對註冊用戶進行身份實名認證,這項識別服務採用了曠視科技(face++)提供的人臉識別、活體檢測技術,來判斷每一位實名用戶各項信息的匹配程度。

鈦媒體記者在今年3月份頭條號發布的一則「嚴厲打擊發布不實負面信息的公告」中看到(如下圖),一共20個頭條號遭遇禁言處罰,並有3名頭條號運營者被封禁。

註冊頭條號的用戶,首先都將要求閱讀並接受一份《頭條號管理制度》,於頭條號名稱規範、簡介規範、審核標準、處罰標準等都做出了明確規定。

由於每個身份證僅限註冊一個頭條號,與其他平台相比,頭條號的審核規則是最嚴格的。一旦因運營者違規操作被平台封禁賬號,「被封禁賬號的身份證也不予釋放」,這也意味著,嚴重的違規操作者可能面臨永久加入「黑名單」的風險。

二、審核機制:如何「幹掉」虛假信息

在內容審核方面,各大內容型平枱曆來都是高成本、高投入,內容把關的技術能力,對於內容型平台來說更是一條生死線。鈦媒體對國內某第一陣營直播平台的採訪中發現,內容運營的人力成本、技術和設備採購成本加在一起,一個典型的內容型平台在內容自查上的投入要超過一個億人民幣。

低俗、謠言、標題黨——堪稱國內外各個內容平台的三大毒瘤。

針對於此,今日頭條在內容審核上採取了一套獨家的「四審機制」,也就是說,在今日頭條的內容審核流程中,文章100%過人工審核,通過「人防」和」技防「的結合,所有文章通過技術過濾、人工審核、盲審、複審的「四審機制」才能發布。

「盲審」環節,充分體現了機器+人工審核的優勢:機器根據規則和比例抽取文章,將同一篇文章同時分配給兩位審核員,如果兩人判斷一致則通過,判斷不一致會再分配給第三個人進行把關,通過這種模式最大程度降低了因審核員主觀原因、個人問題造成的誤放、漏放。

那麼,最為頭疼而且隱蔽的標題黨,又是怎樣攔截的呢?今日頭條技術負責人向鈦媒體介紹,「標題黨可以通過人工+機器三層攔截,進行識別。」

今日頭條研發團隊建立的數據模型,目前可以準確識別出「標題黨」的內容。一篇完整的文章進入平台機器經識別和處理,最終從「機器」流程中放出來,今日頭條的技術負責人向鈦媒體還原出了一個完整的識別過程:

當平台識別出標題黨的關鍵詞後,「發送彈窗」的方式提示並勸導作者打住這樣的行為;通過模型識別而來的標題黨,平台將召回並人工確認;最後一道工序交給人工——人工複審將對從各種渠道召回的文章進行最終的人工評估複審。

今日頭條還首度向鈦媒體披露了這樣一個數據:截止2016年底,演算法模型對「頭條號」低質、低俗內容的識別準確率提高到80%,並可將頭條號平台上超過90%的低俗內容識別出來。

對於擁有龐大用戶的內容平台來說,提高自律能力也是最大限度提高「審核」效率的途徑。今日頭條也設置了完善的舉報功能,在今日頭條,有一部專人守候的舉報電話7×24無間隙工作,同時設置了電話、郵箱、APP、PC等不同類型的舉報埠。

為了防止虛假信息擾亂經濟秩序和社會秩序,今日頭條還利用人工智慧技術,讓機器結合用戶舉報和跟帖評論,甄別虛假信息。此外,今日頭條還推出精準闢謠功能,如果用戶閱讀過的內容被證實為謠言,系統將第一時間向所有看過該文的用戶推送相應闢謠文章。

三、輔助人工的技術「外腦」

資訊分發平台在內容傳播上的最大困擾,是「舊聞新編」、「虛假信息」的受害者不計其數,文字識別技術是這類垃圾信息的第一道屏障,文字、圖片、視頻乃至廣告,一旦不符合內容質量和內容安全的要求,即便騙得過人眼,也很難騙得過機器。

據悉,今日頭條的文字識別技術,還可以識別出用戶評論的內容,並且將其派給人工處理。

隨著短視頻內容的爆發,視頻內容審核成為「委員會」的重點項目之一,針對於此,今日頭條祭出了動態關鍵幀技術、圖像建模識別技術和OCR識別技術三大殺手鐧。

動態關鍵幀技術,利用視頻場景變換關鍵幀檢測視頻運動變化情況,並抽取出發生場景變化的關鍵幀,提供給審核員進行審核。即便是潛伏在視頻中的低俗內容、反動內容及廣告,也能被甄別出來

圖像建模識別,則在色情低俗圖像識別上最好用。這種基於深度學習的圖片識別技術,可以模仿人腦機制,讓機器自動學習圖片的特徵。最終建立的圖片模型,能對每張圖片和視頻動態幀截圖進行低俗識別。

OCR識別技術,則能通過機器自動提取出附在圖片上的文字,確保低俗有害文字不能通過圖片變相傳播。

在目前看來,這些技術的運營已經取得了一定的效果。數據顯示,過去一年,平台上共標註圖片樣本110萬,低俗視頻樣本1萬,攔截率較之前人工攔截提升了73.71%。

網路安全法的出台,在中國互聯網發展史上具有標誌性意義。和今日頭條一樣,中國的互聯網巨頭們責任重大,不過,各家平台想要共同凈化網路、維護安全生態的意願,根本上還需要足夠強大的技術能力來支撐。

(本文首發鈦媒體)

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 TechWeb 的精彩文章:

Box CEO通過貝佐斯汲取靈感 為來年的公司做準備
三星首款雙攝手機渲染圖曝光:6GB RAM+驍龍660
8GB大內存+變焦雙攝!努比亞發布Z17無邊框防水手機
菜鳥順豐各說各的理就行 為什麼要把阿里雲和騰訊雲扯進來
OPPO官方公布新代言人 竟然是周杰倫!

TAG:TechWeb |

您可能感興趣

王世偉:論信息安全、網路安全、網路空間安全
你的網路安全嗎?
歐盟網路安全法案:建通用網路安全認證系統
首都網路安全日參展安全廠商巡禮
「凈網行動」:孟連縣公安局召開全縣網站及重要信息系統網路安全檢查工作會議
網路安全創投風向何方 新時代的網路安全——網路安全創投高峰論壇
關於網路個人隱私安全,周鴻禕委員有話說
物聯網即將全面改變網路安全
人工智慧如何重新定義網路安全?
為信息安全加把鎖 《網路安全法》為互聯網保駕護航!
網路安全與人工智慧的演進
譚曉生:大安全時代如何保障國家網路空間安全
關於個人信息安全和網路安全的萬能答案
無「網路中立」的時代,我們該如何保證網路安全
網路安全那些事兒
DNS安全為何是網路安全的核心?
鄔賀銓:從網路安全到數據安全
哈爾濱中軟分享:物聯網即將全面改變網路安全
人工智慧之於維護網路安全是一把雙刃劍
深信服:網路信息安全龍頭