今日頭條整改首先擴招審核團隊，靠機器學習推薦內容已是偽命題？

科技 04-11

今日頭條整改行動從本月正式開始。

「今日頭條將強化總編輯責任制，全面糾正演算法和機器審核的缺陷，不斷強化人工運營和審核，將現有6000人的運營審核隊伍，擴大到10000人。」4月11日早4時33分，今日頭條創始人&CEO張一鳴在其《致歉和反思》信中說。

作為國內最大的智能內容平台，今日頭條一直以機器學習推薦技術引以為傲。此次大幅度擴充運營審核團隊，或許是認為，以機器學習為主導的機制，已無法負荷龐大的內容審核工作，需要加大人工輔助力度了。

指控、處罰、責令關閉內涵段子

早從今年3月開始，用戶可能或多或少的有所感覺，甚至提出疑問：包含低俗、違法、虛假等內容的今日頭條，是不是快要不行了？

3月8日，央視財經發布《「今日頭條」終於上了「頭條」！無視監管，竟做起這種「黑勾當」！害苦2.4億用戶...》文章，直指「今日頭條」利用「二跳」手段發布虛假廣告，嚴重侵害消費者合法權益，並危害到相關藥品企業正常經營；

3月29日央視《經濟半小時》欄目直接指出，今日頭條枉顧監管約談，明著合法，暗中「二跳」廣告的「黑勾當」；

3月30日，就廣告違規問題，北京工商行政管理局海淀分局對今日頭條行政作出處罰，沒收廣告費並處以廣告費用3倍罰款,總計達94.4萬元人民幣；

4月4日，國家廣播電視總局對今日頭條、快手兩家網站的主要負責人進行了約談，要求全面整改；

4月9日，多家應用商店下架今日頭條APP，暫停其下載服務3周，時間從4月9日15時起至4月30日15時止；

4月10日，國家廣播電視總局責令今日頭條永久關停「內涵段子」。當晚，今日頭條關停「內涵段子」。

近一個月的時間，央視及國家相關監管部門接連不斷的的指責，幾乎在大眾面前將今日頭條批的體無完膚。為此，今日頭條方面承諾，將把4月作為整改月，全面清查產品中存在的問題，並定期向監管部門彙報整改進度，向公眾同步整改結果。

從2012年發布第一個版本至今，今日頭條僅用不到6年的時間，便發展成為了國內最大的智能內容平台。相關數據統計，截至2017年7月31日，今日頭條的日活躍用戶數已經達到了1.2億，較2016年同期翻了一倍多。

眾所周知，機器學習推薦機制是今日頭條最大功臣。縱觀今日頭條推薦的結果看，其智能演算法大致走了以下幾大流程：

一、數據抓取，從用戶在該平台的瀏覽動態或其他賬號日常動態中抓取相關數據。

二、用戶分析，每個用戶都是一個資料庫，信息瀏覽行為越多，其資料庫中的數據也越多。智能演算法會對這些數據進行整合與分析，從而提煉出該資料庫的關鍵詞。

三、內容審核，智能演算法主要做了兩件事，消重和審核。

消重，就是辨別內容相似度，以避免推薦給用戶的內容過於重複。顯然，這一點，今日頭條做的並不好，用戶經常會看到相似內容，甚至標題、圖片等都很相似；

審核方面，這是今日頭條被嚴厲指責的關鍵問題所在。因演算法尚未成熟，人工干預度低，導致很多未經人工審核的將色情、低俗、虛假、違法等內容通過了審核。

四、新聞推薦，這是與用戶直接關聯的一步。從今日頭條的推薦機制看，內容會被推薦與否，與熱點、點擊量直接掛鉤。這是智能演算法對內容受歡迎程度的一次判斷。

但顯然，今日頭條這一內容平台，並沒有很好的做到其所期望的。

「3月29日央視報道我們的廣告問題後，我不斷反思自己以前的想法，反思公司現在的做法，開始大力推進公司員工提高意識、改進管理、完善流程。」這是張一鳴的反思之一。

而隨後的行動，就是「強化人工運營和審核，將現有6000人的運營審核隊伍，擴大到10000人。」

顯然，今日頭條這個人工智慧內容平台，已經認識到機器學習的不足，開始更為重視人工了。對此，有網友提出質疑，從人工到人工智慧是進步，從機器回到人工，這是歷史和科技的倒退？

去年11月，張一鳴在2017今日頭條創作者大會上透露，其頭條號賬號總數超120萬，平均每天發布50萬條內容，創造內容消費達48億次。

以每個賬號每天投稿5條內容算，頭條好每天的投稿內容達600萬條。除此之外，今日頭條旗下還有悟空問答、微頭條、西瓜/火山/抖音以及已經關停的內涵段子。該平台每天的投稿、上傳內容超4000萬。

僅靠1萬的人工，顯然是無法完全負荷審核任務的。僅從目前來說，今日頭條的審核推薦機制，依舊以機器學習演算法為主導，並加以大量人工輔助。

其實，除了今日頭條，新浪微博、微信公眾號、快手短視頻、界面等平台也有相關的機器學習審核演算法的加持。如新浪微博，其會實時更新關鍵詞，如果用戶發布的內容涉及到相關關鍵詞，就會被屏蔽或刪除。

而微信公眾號作為現今流量排前的內容平台，其在內容審核方面則較為嚴謹。有過運營經歷的人應該經常碰到，一旦提交審核的內容中提及了一些敏感內容或辭彙，其審核時間就會非常得長。

很顯然，在平台多元、領域多樣、數量越來越龐大的情況下，通過機器學習審核推薦內容是大勢所趨。僅靠人工，非得累死。

不過，當前的機器學習演算法能工作質量，還遠不及人類，否則，今日頭條也就不會陷入如此窘境了。就像扎克伯格曾經說的一樣，Facebook對人工智慧非常依賴，希望能夠通過AI改善審核機制。但想要完全依靠AI審核內容，可能還需要5-10年的時間。

機器學習演算法作為每一次內容低劣指控的「背鍋俠」，需要的，可能只是時間和耐心。在沒有完全成熟之前，可以是主導，但絕不可以是唯一。技術提升加以人工輔助，是對用戶最大的負責。

「我是工程師出身，創業的初心是希望做一款產品，方便全世界用戶互動和交流。因此，在過去幾年間，今日頭條將更多的精力和資源，放在了企業的增長上。現在，我們必須重新梳理我們的願景，保證所『創作』與『交流』的內容是積極向上的、健康有益的，能夠給時代、給人民帶來正能量。」張一鳴說的似乎很誠懇。

快手的創始人&CEO宿華曾表示，技術讓每個人前所未有的得到了表達自我的機會，但也帶了新的社會問題。因為幾千年來，人們所適應的，是由人呈現出來的世界。我們需要去適應新的世界。

當然，這裡不得不提一句，機器學習演算法是在抓取用戶「行為資料庫關鍵詞」之後才進行的推薦。如果，你能抵制住低俗內容的誘惑，又怎會被這些內容推薦「干擾」？

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 鎂客網 的精彩文章: