「鑒黃師」這個沒人性的工作要逐漸被機器取代了

最新 08-20

前些年，有一些新興職業曾經引發過熱議，在這其中，「鑒黃師」顯然是討論非常多的職業。很多好事者覺得這個職業很好，能夠看大量的「有料」視頻和圖片，還有工資拿。不過真實的情況則是，如果讓你連續每天不停地看這些資料數個小時，對身心不僅是一個很大的傷害，還是一件很沒有人性的事情。

而且必須要說的是，「鑒黃師」更多的時候還是用來鑒定傳統的黃色影碟、錄像之類，而到了互聯網蓬勃發展的時代，這個職業就有些跟不上時代了。原因也很簡單，那就是網上的數據實在是太多了，人力根本看不過來，而一味的增加人手顯然也不是一個辦法，因為會帶來高昂的管理成本，所以如何能夠更好的解決這些不健康的內容，就成為一個非常重要的問題。

人工智慧開始接替人類「鑒黃」

隨著技術的不斷提升，人工智慧開始爆發，成為這兩年的熱點。而人工智慧是什麼？又能做什麼？不僅有很多的展望，還有很多的探討，不過最為直接的，就是可以開始利用人工智慧來解決鑒黃這件重要又沒人性的事情了。

對於人工智慧而言，最基本的幾個方面就是圖像識別，語言識別，自然語言處理等，最擅長的就是進行大量的圖像、聲音的區分，可以說真的是為鑒黃而生。而目前在阿里雲的服務中，鑒定非法、違規內容已經成了非常重要的一項，而在這些非法內容中，最常見的自然就是黃色內容了。

為此我特意專訪了阿里安全部高級演算法專家威視和產品專家念夏，去深度地了解一下這個很多人都感興趣的話題，我們是如何訓練人工智慧去完成鑒黃工作。

事實上這個功能的核心需求者其實是廣大中小網站，當時阿里雲上差不多託管了中國四分之一的網站，他們特別需要更為低成本和高效的安全篩選機制，因為不然很有可能就被網民上傳的非法內容坑掉。阿里的安全部門很早就開始利用機器學習的方式來進行非法內容的篩查和識別，2015年後，隨著各方面技術尤其是硬體能力、存儲能力等的提升，開始了更為深度的學習和提升。

（阿里AI鑒黃師，用技術解決社會問題）

到了2015年底收集五福的大活動，因用戶要上傳大量圖片，這成了考驗阿里AI鑒黃能力的一次重要「戰役」，到了2016年，阿里就已經做到開放這個能力給微博，幫助微博進行包括頭像在內的圖片審核了。

機器加人工，可能是最終解決方案

人工智慧的鑒黃模型並不複雜，或者可以說大部分鑒定某一類內容的的方法都是一樣的：先做好分類的標準，再去收集大量的樣本，根據標準給樣本打上標去讓模型深度學習，最終就會得到一個鑒定的演算法。這種演算法不僅僅用來篩查黃色圖片，也會幫助淘寶這樣的電商平台來尋找違禁違規產品，對於不同的網站鑒定的側重點不同，但毋庸置疑的是，對於大部分網站運營者來說，用戶上傳內容的合法、合規性審查，是一個實實在在的剛需。

隨著人工智慧的能力不斷上升，這種鑒定包括不限於圖片，甚至文字和視頻也可以進行相應的鑒定。比如說可以通過識別文檔的文字內容，來判斷內容是否違規，提取視頻文件的圖像和聲音進行鑒定，來判斷視頻是否存在涉黃違法的隱患。可以說人工智慧大大提升，阿里安全，用技術解決社會問題的能力大大提升，也降低了運營中的風險。尤其在當下這種每天海量數據上傳的情況下，人工智慧鑒黃帶來的效率提升，更是實實在在的。而這種鑒定能力，甚至還可以支持多國語言和多地方言，確實變得越來越強大。8月21日，在北京舉辦的網路安全生態峰會上，阿里將集中展示這些技術。

不過，人工智慧畢竟還是機器，必定也是存在一定的誤報情況，或者是一些新情況的理解不足，比如一些特定場景下的藝術品展示，如果不加甄別，也被劃入涉黃的範圍內，自然也是一件遺憾的事情。再就是一些新增的特殊場景的特殊要求，也可以通過訓練人工智慧來完成調整，威視介紹說，比如某些直播對主播抽煙、吃香蕉、直播著裝等有所限制，很多時候都是通過人工智慧完成初步鑒定，然後將可疑行為再交給人去進行最終的判斷和處理。

這樣做不僅提升了效率，也保證了處置的準確性。而這種人工智慧加人工的雙重篩選、判定的模式，目前看將成為未來的主流鑒定模式。而隨著人工智慧的精度不斷上升，人需要判斷的內容比例也會越來越低。

人工智慧鑒黃的社會意義

總體而言，阿里發展AI鑒黃技術是一項非常有社會意義的事情，因為人工智慧鑒黃這個能力的最大價值，除了幫助更多企業可以以更低的成本，來完成自己網路業務的合規化，更為重要的是，它也為全社會解決網路色情等問題，提供了支撐。

從2014年開始，全國「掃黃打非」工作小組辦公室、國家互聯網信息辦公室、工業和信息化部、公安部就聯合推出了「凈網行動」來打擊互聯網製作傳播淫穢色情信息行為。一開始這是一個很艱巨的任務，而隨著人工智慧鑒黃的能力越來越強，這項工作的難度也開始下降，效果也越來越強，對人力的要求也越來越少。

隨著人工智慧能力的不斷提升，加上對內容管控力度的不斷加強，阿里AI鑒黃的靈活性和彈性也越來越大，從而去適應政策和社會要求的多樣性和複雜性。

不過這其中也存在一些障礙，比如說，目前的鑒定標準，已經達到了比較高的水準，但一些特殊不文明行為的鑒定，比如一些封建迷信的行為，因為在樣本數據上的獲取可能就存在一定難度，所以在學習和形成鑒定能力的過程中就存在一定難度，這也給未來的發展提出了新的問題和挑戰。而這也只能通過不斷地優化演算法和採集更大量的圖片等信息數據來實現，所以讓人工智慧完全去理解這個世界，還是需要一些時日。

目前國內的大部分科技企業都在進行自己相關的人工智慧業務的研究，而阿里因為是提供的互聯網基礎服務，所以在內容鑒定審核這個方面的優勢也比較明顯，不僅通過阿里雲在輸出各種人工智慧的能力給企業和社會，也在通過達摩院、圖靈實驗室等機構在不斷深入研究更多的未來發展方向。而隨著越來越多的信息積累，相信人工智慧的威力也會越來越強大，最終可以代替人類做更多的事情。

萬能的大熊

微博2015 2016 2017連續三年獲得科技領域、電商領域十大最具影響力大V

藍鯨自媒體聯盟2017年年度科技大V

公關品牌專家：曾負責360手機助手、360手機遊戲、360隨身wifi、360兒童手錶、360行車記錄儀的品牌營銷，均為行業第一品牌。

暢銷書作者：《格局逆襲1》，銷量超過十萬冊。《格局逆襲2》，上市兩個月銷量突破五萬本。

微營銷第一社群大熊會創始人：2013年創建大熊會，位列中國社群影響力排行榜前五，是國內最大的致力於研究和引領微營銷發展潮流的社會化營銷社群組織，成員已超七千人。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

TAG: |