谷歌利用機器學習刪除了Google Play中的70萬個垃圾應用,同比2016年增加了70%
AiTechYun
編輯:nanan
1月30日,Google分享了Google Play努力保護Android用戶的細節,他們的工程師、政策專家、產品經理和運營專業人士都在監視商店是否存在誤導性和有害的應用程序。2017年,Google刪除了超過70萬個違反Google Play政策的應用,比2016多了70%。
Google不再分享Google Play應用的總數,所以我們必須依靠第三方的估算才能把這個70%的數字放在正確的角度。據了解,2016年12月的Google Play應用程序總數為260萬,2017年12月為350萬,增長35%。然而,有多少是不好的應用程序,誰也說不準。
我們所知道的是,被移除的不良應用數量增長速度超過了商店中的應用總數,如果考慮到Google昨日發布的下一個統計數據,這將是有意義的:在2017年之前,有99%應用程序的內容都可識別,且任何人都可以安裝。
Google表示,這是有可能的,因為它的機器學習模型和技術來檢測濫用的應用程序內容和行為,比如模仿、不恰當的內容或惡意軟體。該公司聲稱,通過Google Play獲得惡意軟體的可能性比通過外部來源安裝應用程序要低10倍。
Google Play團隊去年開發了新的檢測模型和技術,可以大規模地識別屢犯者和濫用的開發者網路。這導致2017年阻止了10萬名不良開發人員,使得不良行為者更難創建新賬戶並嘗試發布更多不良應用。
Google給出了在2017年刪除的三個不好應用程序的例子:
複製卡片:通過模仿著名的應用程序來欺騙用戶,因為這些標題會為特定的關鍵字獲得大量搜索流量。通過欺騙性的方法(例如使用易混淆的unicode字元或在不同的地區隱藏模擬應用程序的圖標)模擬應用程序就會進入Play商店。在2017年,Google拿下了超過25萬的「山寨版」應用程序。
不當內容:不允許包含或推廣色情、極端暴力、仇恨和非法活動等內容的應用程序。改進後的機器學習模型篩選了大量的應用程序提交,並將它們標記為潛在的違規行為,幫助人類評審員檢測並屏蔽有問題的應用程序。在2017年,Google刪除了成千上萬個不當的應用程序。
潛在的有害應用程序(PHA): 可能會危害人或其設備的惡意軟體,如進行簡訊詐騙的應用程序,充當木馬,或者是phish用戶的信息。發現這些不好的應用程序是非常重要的,因為惡意的開發者會花費更多的時間來使他們的應用程序看上去儘可能合法。Google表示,與2016年相比, Google Play在2017年將PHA安裝率降低了一個數量級。
Google認為, 雖然大多數開發者的觀點是最好的,但一些不好的應用程序和惡意開發者「試圖逃避檢測,進入Play商店,讓人們和他們的設備受到傷害」,因為「大規模和全球Google Play的覆蓋面使這個平台成為不良行為者的目標。事實上,儘管有大量不良應用程序和惡意軟體開發者的記錄,但仍有很多人迴避了Google Play的安全性。
例如,安全公司Check Point僅在本月就報告了惡意手電筒廣告軟體應用程序和在Google Play上顯示色情廣告的惡意軟體。前者跨越了22個不同的手電筒和實用程序應用程序,下載量高達750萬次,而後者包括60個遊戲應用程序,下載量高達700萬次。
對於各種糟糕的應用程序,Google表示,他們「非常認真地對待它們,並將繼續創新我們的能力,以更好地檢測和保護那些被濫用的應用程序和背後的惡意行為者」。按照這個速度,Google將在2018年刪除100萬個不好的應用程序。


※Gary Marcus再發萬字長文,列14個Q&A回應機器學習批判言論
※新手必備!十大機器學習演算法之旅已啟程
TAG:機器學習 |