發文秒刪?呵呵,AI認為你有毒!
國內大大小小的論壇如知乎、貼吧、天涯等,都是各路文人雅士英雄豪傑,各抒己見的公平公開的交流平台。但這些平台的用戶數量都極為龐大,因此如何維護交流氛圍,如何管制不良言論就成了這些平台管理者最重視,亦是最頭疼的地方。而近幾年AI技術如此火爆,甚至有無數磚家預言未來是人工智慧的時代,那我們是不是可以考慮,讓AI代勞刪帖管理的重任呢?
最近,牛叉的Google公司用它的人工智慧開發了一個叫做 Perspective的軟體介面,它的用處就是在網上找各種言論,然後給它們打分評價是否「有毒」;Google對於言論有毒的定義為「粗魯,不尊重或者沒有道理」,Perspective會根據這個標準從0-1分進行毒性評分。嗯?聽起來很厲害,而且這些個AI工具說真的雖然我搞不清楚它的工作原理,但是還是覺得很厲害,下圍棋都能贏了柯潔,管理平台言論還不更是小菜一碟?
但,事實可能並不那麼樂觀。(貼吧系統刪帖=度娘の大姨媽?)
有些人跟這個工具刷了點小聰明,結果十分出人意料……有很多看起來完全沒有問題的語句,在Perspective的眼裡卻毒性強大。
我也測試了一些政治立場相關的語句,更為詭異的結果隨之而來。「我恨納粹」的得分為 0.64%,比「我愛納粹」的毒性 (0.56) 還高。
跟Google有過深度合作的Disqus公司,在過去近一年半的時間內收集了1億條網路評論來訓練這個AI工具,並且這家公司還推出了一個優化模塊來幫助Perspective過濾有毒評論。但為了確保言論自由,這家公司設定的規則為「必須達到0.98分才視為必須進行屏蔽的言論」,這足夠放行許多歧視、甚至威脅生命的言論。
比如「拯救一條鯊魚,吃一個中國人」(Save a shark, eat a Chinese) 的毒性只有 0.58,被該系統判定為「不確定是否有毒」;而「我會終結所有中國人的生命」 (I will end all Chinese people』s lives) 的毒性為 0.85,並未達到 0.98 必須屏蔽的標準。
本來,用人工智慧來代替人工進行網路言論綠化,是一個非常不錯的方向和點子,但目前礙於技術和邏輯設定,這個Perspective實在是太好調戲了,言論是由人腦內多達億萬次神經碰撞思維產生的,人工智慧沒有思維,永遠也鬥不過人類……
而目前,若是執意要運用這種技術來進行網路言論管理,那就會導致那些成天無所事事在網路上發表煽動言論的鍵盤俠被包容了,而那些敢於標明同性戀和少數族裔等異化身份,用發言來表達立場、倡導更前沿和包容觀點的人們反而成為了被打擊的對象。
真不知道是我有毒,還有「你」有毒啊,小P。
點擊展開全文
※UI設計這麼簡單,憑什麼年薪30W
※只需4個月,你也能做出這種廣告圖
TAG:思途科技在線 |