網路爬蟲恣意橫行,數據黑產必須打掉
文丨南都社論
「全國各省市三百多行業數據信息採集」「python爬蟲程序數據採集代寫軟體,專業老手,定製化服務」……南都記者調查發現,數據採集業務「風光無限」的背後,隱藏著一條非法爬取用戶數據的黑色產業鏈——「專業老手」編寫爬蟲軟體、提供軟體定製服務,黑產團伙購買軟體批量生成「大數據」信息再轉手出售,亂象層出不窮。
所謂網路爬蟲,指的是一種按照既定規則自動抓取網路信息的程序或腳本,可以視為一種網路機器人。也就是說,網路爬蟲可以在信息海洋里代替你的眼睛和手,按照你的需要為你獲取數據。本來爬蟲是可以大大提升效率的工具,但如被不法分子利用,就成了新型犯罪的工具。
大數據時代,數據信息的價值堪稱新時代石油,是非常重要的資源,也和每個人的個人隱私和生活緊密相連。正因如此,收集各種平台上的數據,才有了變為生意的市場和可能。在某二手交易平台上,有不少提供所謂「大數據」採集信息服務的商家,聲稱可進行「專業爬蟲」「各大網站數據採集、數據處理、數據分析」,還有商家叫賣數據信息採集器,購買軟體無限量導數據還幫忙介紹客戶。有爬蟲賣家稱可抓取的信息覆蓋全國300多個行業,每個行業只需要49元;智聯招聘的上萬份簡歷被打包出售,每份只要一塊五;各種網站、公眾號、趕集和58等同城平台、鏈家等房產中介平台,以及餓了么等外賣平台,信息都有得賣,信息採集費用按難度從100元到300元不等。
花兩杯奶茶的錢就能買到一個行業的信息,花10杯奶茶的錢高級的信息都能到手,而你花了多少年的積累用了多少天的精力甚至出了幾百塊找人排版的簡歷只需要一塊五。價格之低,獲取之便利,令人咋舌。
這種新型犯罪導致的傷害深度廣度都是傳統犯罪所不能比的。傳統的偷盜,被盜的物品價值多少損失就是多少。而大數據尤其是用戶行為數據是一個平台的核心資源,對於平台價值和往後策略都可能有著關鍵性的影響。平台的大數據被盜,整個平台的產品設計、價值定位都可能受到影響,而如果平台用戶信息泄露嚴重,平台的信譽也會隨之降低,對前景的影響難以估量。企業之間因為相互爬取數據已經引發了許多不正當競爭案件,很多公司也已經開啟了反爬蟲策略。而需要注意的是,即使通過爬蟲非法獲取的是公開數據,沒獲得平台授權也可能構成侵權甚至違法犯罪。
網路爬蟲類新型犯罪,影響的不只是被爬取數據的平台和網站,更是上面的每一個用戶和被牽連的人。二手平台網路爬蟲賣家售賣的內容包括著名招聘網站的簡歷尤其是中高端簡歷、法院的判決書、淘寶的買家和商家信息、小區業主信息甚至網貸實時申請數據。當這些數據被隨意售賣,隱私蕩然無存,你在不法分子面前就是一個透明人,可以輕易地被掌控。而且,這樣的數據抓取的不是針對個人的報復,而是覆蓋所有人的廣泛收集,即使你再小心都不可避免會在網路上留下個人信息,那麼,信息被爬取之後,等待你的很可能是財產被盜、電信詐騙、敲詐勒索甚至人身威脅,而這一切你可能毫不知情也難以防範。
網路爬蟲新型犯罪危及每一個公民的權益和安全,但依靠個人幾乎防不勝防。目前,這一類新型犯罪已經有一部分被偵破,如號稱最大的簡歷大數據公司被查。但在網路爬蟲犯罪如此普遍且猖獗的當下,不僅需要偵破個案,而是由各個包括企業在內的社會關節共同組成的一個有序常態化防護網,才能給公民最基本的信息安全保障。


※我國力爭2020年底全部消除66人以上超大班額
※政策驅動 教育板塊有望駛入「快車道」
TAG:今日科學 |