當前位置:
首頁 > 最新 > 我們和一位大數據從業者聊了聊他眼中的信息安全

我們和一位大數據從業者聊了聊他眼中的信息安全

點擊 「下載」,你便和互聯網完成了一次交互;所有人被順勢處理為數據,置於二進位空間。這是前所未有的挑戰:個人被大數據淹沒,隱私傳輸於伺服器之間。我們被人工智慧打敗,似乎只是時間問題。

科技代替我們工作、選擇,甚至行使權利,也奪走了我們的存在價值與安全感。數字信息化的世界是人類歷史上從未遇到過的問題,而遙遙無期的不確定感只會讓人更加不安 —— 可我們不願也無法抗拒時代的進步,但又該如何面對飛速改變的未來?沒人知道答案。

於是在未來到來之前,我們只能選擇主動去了解不安;進而使用下載這個動作,來擁抱這些必將永遠存在的不安。

人工智慧、大數據這些科技發展過程中出現的新名詞概念比進程走的更快,當人們生活中還沒多少準確的應用場景時,新鮮詞的傳播普及速度已經抵達互聯網金字塔的最底層(儘管可能你和 「他們」 都一樣,並不知道這個詞的含義究竟是什麼)。炒熱概念在喜歡製造訊息垃圾的新媒體時代簡直輕而易舉,而真正埋頭扎在行業里的人卻被極速發展的更新迭代裹挾前進,鮮少發聲。

大數據一詞從出現在公眾視野並發熱發酵已經四年有餘了,2015年貴州大數據交易所掛牌運營,近年來各地數據交易中心和大數據產業園遍出。我們越來越感受到自己的方方面面都能被數據化,這其中除了有可量化的個人信息,甚至還有你所認為不能被量化的情感動態和個性信息 —— 它們都可能在你深夜不睡聆聽的音樂和一口氣怒點淘寶的消費行為中被暴露出來,並進一步被採集分析。

我們跟你一樣,惱於騷擾電話和簡訊在精準營銷的外殼下把自己包圍;惱於大數據分析剝繭抽絲地把一切消費者分門別類,使主觀行為不再具有個性色彩;惱於自己的產生的數據和信息以及其中的價值在不知名的市場里一次次被倒手轉賣和利用,自己卻毫不知情也分不得一點好處……於是我們特地找來了一位大數據產業的多年從業者 Senker,來聽聽他來講講這個產業,以及他是否也和你我一樣,為信息與數據所惱。

VICE:請你先向我們介紹一下你的工作吧,身為一個大數據產業從業者,你的主要工作內容是什麼呢?

Senker:我現在所在的單位在中國大數據交易市場上的角色是一個提供數據清洗加工等增值服務的交易平台。我負責市場方面的工作,即在市場上找到數據的買賣雙方,讓他們加入到我們平台上來進行數據交易,這個工作任務細分下又包含了政府數據源和市場數據源 —— 所以既要和政府談,也要和社會企業談。

目前大家對大數據的認識還不夠清晰準確,所以其實我們從業者很大一部分精力還要給客戶先普及什麼是大數據、什麼是大數據應用,最後才進行到數據的流通和交易。

數據都是怎樣被交易的?

交易的數據大概有兩類,一類叫原始數據,一種叫數據產品。原始數據可以直接通過線上賬號付費購買流通,數據產品則需要加工服務,花費的時間也比較長。但原始數據不代表底層數據(底層數據就是指包含個人信息的數據),在交易所內交易的數據必須都是脫敏脫密的,都是清洗過的數據。這個事情其實很簡單,難的是對數據的加工和建模。好比你從地里把一顆土豆拔出來,要把土豆洗乾淨再擺到市場上去賣,洗完的土豆就看不出是哪裡來的土豆了,但是怎樣把土豆做成各種菜品,做的多好吃才是考驗人的部分。

交易所在數據交易過程中扮演的角色類似於能夠提供服務的淘寶平台,它的營收一方面來自交易平台傭金,一方面來自為客戶提供數據產品的服務收費。

雖然你說交易的數據都是清洗過的數據,是不涉及隱私的非底層數據,但在清洗的過程中是否有泄漏個人信息的可能?

這個可能是肯定有的,數據在任何一個階段都可能存在泄露風險,所有的東西都沒有絕對的安全 —— 互聯網沒有絕對安全,國家土地也沒有絕對的安全。我個人覺得一味去關注數據泄露是一個永遠無法無解的問題,全球任何一個國家都沒有敢說自己的資料庫是絕對安全的。

那你自己有對數據隱私的擔憂嗎?

其實就數據隱私而言,在目前中國這個不是擔心,而是已經發生了的事實 —— 我們都知道我們的個人信息通過不同技術手段能在各類平台上被拿到。通過第三方的一些非法交易和販賣,我們的個人信息是完全暴露在整個社會體系裡面的。

其實隱私問題現在已經是個問題了,而並不是說即將發生或者怎麼樣,反而現階段我覺得是國家開始越來越重視這個東西。以前的隱私法界定的東西跟不上互聯網的高速發展了,網路安全法還有對跨境數據的流通管理等等都是對這部分的一個補充。國家已經開始在做很多工作了,隱私問題逐漸會得到更多的重視和法律保護,現在市場上大量的個人信息被非法販賣的情況會變少,而且也許以後,目前受到大家爭議很大的互聯網服務 「隱私協議」 霸王條款也會越來越少。

什麼樣的數據泄露會是有比較嚴重的後果的?

這個要看是對個人還是對國家。對個人來說,最最敏感或者說最危險的,是我們個人信息被流通到一些不法分子手上形成詐騙。當你的姓氏、周圍的朋友、生活方式和行為習慣等所有的信息都被詐騙集團知道了以後,你是很容易被攻擊的。從最簡單的通過一個假賬號偽裝你的朋友跟你借錢,到大一點的甚至在現實中偽裝成其他人來接近你並成為你的 「知己」 來騙財等等,詐騙無處不在,雖然聽起來都覺得很扯,但其實發生在生活中時你都不一定能覺察到。現在社會上很多詐騙都是搜集到一定數據之後才進行的,因此嚴重程度比以前高很多,每個人都有可能中招。

對國家來說的話,數據有三類,以顏色區分分別是紅色、橙色和綠色:綠色是必須無償公開的信息,橙色是可以有條件公開但沒有直接公開的信息,而紅色則是內網以及政務內部信息,是絕對不能公開的。這一部分數據如果遭到泄露和篡改或者遭受攻擊,後果都是非常可怕和嚴重。但是因為大家平時接觸不到這些,也不會去想到這個國土安全層面的問題。

我們的個人信息數據都掌握在什麼人手中呢?他們對包含我們個人信息的這種利用對我們有什麼利益損害?

首先公安和人社都有你的非常重要的原始個人信息,比如說公安有我們的出生信息、刑偵辦案的時候可以通過三大運營上獲取你的位置信息等等,人社系統里有你的五險一金,遷移軌跡等等。但他們是獨立運營的,同時這些數據相對來說是安全的,因為他們主動泄露出來的可能性比較低,對惡意攻擊的防護等級也比較高。而且他們對信息的收集是用於更宏觀的決策的,再加上信息採集的來源渠道是公開的,這部分信息數據被分析利用的時候對我們的個人利益損害其實不是很大。

但企業所掌握的我們的個人信息則是不一樣的,第一你不知道它的信息渠道來源是什麼,有時候是在你不知情的情況下被隱秘收集的;第二它的流通方式是不可控的,它們在各種地方被不法倒賣,甚至你都可以輕而易舉在電商平台上買到;第三它的用途經常被用於最底層的信息精準營銷,也是我們日常生活中最煩的那種騷擾信息。所以這種情況下對我們個人利益的損害比較大,但這部分也是我們最防不勝防的。

這些不法交易中的數據都是怎麼獲得的?

其實有幾種方式:第一種方式叫網路爬蟲技術,當你在一個公開平台上留下一個賬號,由這個賬號再延展出去的界面和信息都可以全部被搜索到,這都是沿著你的公開軌跡被保存下來的數據。第二種方式是通過半公開或者沒有公開的身份驗證信息來搜集,即所有需要實名驗證的場合。比如我們在酒店住宿,會被錄入個人信息,它就有流出的風險,可能是被酒店員工轉賣的,也可能是被某些黑客攻擊酒店系統盜取的。還有運營商、第三方支付平台、各種你辦理會員的線上線下場所,甚至醫院都有可能是這些數據的獲得來源。

曾經有一次我刷卡完成了一筆大額交易,不出幾分鐘我就收到其他銀行發來的開卡邀請簡訊,這是不是說明他們其實在共享用戶的交易行為呢?

依我的經驗判斷並不會。銀行比較注重保護用戶的數據,同時也不太可能把有消費潛力的客戶共享給其他銀行,再加上銀監會對所有銀行都有規定是不能夠將交易數據流通出去的。你說的情況,很可能是你交易通過的第三方平台,或者是你消費的場所和機構和各家銀行都達成了一些協議,向他們輸出用戶的消費行為。

原來這些人也有可能把我賣了,不過確實很難追溯到這到底是怎麼一回事,也不知道到底是誰什麼時候把我的信息給了誰,挺沒安全感的。

其實我們有一句業內的話,就是在互聯網時代,你是沒有隱私的。因為你所有的行為軌跡其實都是被記錄或者留下可追溯痕迹的。

你手機上所有安裝的APP都儘可能的在早期希望獲得你的各種信息,最簡單來說就是位置。然後這個信息拿回去之後,他就會對你的這個人在整個城市裡面的行為軌跡做一些分析。比如說凌晨12點到第二天7點,你一直呆在某一個地點,那麼就可以把它假定為你的住所,再通過這個住所去評估資產情況,再解讀你的消費能力,或者說結合其他的信息綁定在一起,能做非常非常多的衍生分析。

但是這並不是真正的大數據分析?

對,因為其實我們從業人員一般認為有兩類東西,分別是數據和信息。數據基本上是特徵值,比如說前段時間比較火的17年支付寶的賬單,螞蟻金服默認勾選的那個許可獲取的信息,每一個單獨拿出來就是數據,如果把對標到你個人身上的特徵值去掉的話,就叫大數據。比如說我不知道你是誰,但是我知道有一個人17年在淘寶上花費了多少錢,花費的方向是哪些,這就是大數據中的一個樣本。

當我現在需要分析北京20歲至25周歲這個區間內的男性消費行為時,我買了50萬條支付寶的這個數據過來,這個數據裡面沒有個人信息,每一條數據背後我都不知道是誰,這就是大數據應用場景。這個信息可能會用於我最後決定在北京什麼區域去開一個店的決策,但是並不是用來給所有潛在的會來這家店的人打電話通知,這就是區別。

一旦說這個數據裡面有你的信息能追蹤到你,那我就知道你是誰,並且知道你在淘寶上大概花多少錢,作為經銷商我就會給你不斷投放廣告、打電話,這個就叫做信息的販賣或者信息販賣之後的營銷,就不是純粹的大數據分析了。

所以大數據交易所的交易是一個很乾凈的交易,我們平常總覺得自己的信息被別人交易,然後給生活造成了很多麻煩的這個鍋不是大數據背的。

對,這真的不是大數據背的。因為大家對這東西不太懂,都會以為是大數據害了我,大數據導致我的信息各種被販賣。其實,2016年在整個中國可追溯或者說可查詢的黑市數據交易額有500個億,然而我們三年的交易額才三億。因為我們的交易都是合法合規且公開的,所以這個體量相對於整個數據交易市場來講,真的非常小。

那這似乎就像黑客與白客一樣對吧?有數據處理能力的人有可能會在黑市上提供服務,也有可能會給合法市場提供服務。

其實黑客我們不一定是一個絕對的貶義詞,有時候它是指一些技術非常厲害的人,如果說挖掘數據或者獲取數據的時候是通過合法合規的途徑取得的,並且分析數據能力也很強,那麼我認為他就是一個擁有 「黑客」 技術的白客,如果說是通過一些非常非法的手段去獲取到信息,並且用於非法非常的用途,那就是一個傳統意義上的黑客,但從黑客轉為白客,去給社會或者說給企業做一些真正的數據應用服務的情況也是存在的。

採訪的最後,我向 Senker 討教我們在生活中如何儘可能地去做一些事情來保護自己的數據安全爭取一些主動,他告訴我,在使用 APP 時要少授權給 APP 獲取自己的位置信息,注意看清服務條款和授權協議 —— 可是實際上不論有沒有看清其中的條款多麼 「霸王」,只要想使用這款 APP 以及它帶給你的服務,你就得勾選同意。

這就是蓬勃互聯網時代,誰都無法拒絕。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 vice中國 的精彩文章:

Y-3 發布2018年秋冬系列
Off-White 發布最新平價系列

TAG:vice中國 |