當前位置:
首頁 > 新聞 > 隱私到底能不能賣?怎麼賣?矽谷直說

隱私到底能不能賣?怎麼賣?矽谷直說

矽谷Live / 實地探訪 / 熱點探秘 / 深度探討

Facebook、谷歌們,都保持冷靜,跟歐盟認慫吧!

一條推特引發的浪潮

位於南半球的紐西蘭,秋分時節是三月中。一個叫做迪蘭·馬凱(Dylan McKay)的年輕程序員慵懶地玩兒著 Facebook,他想起昨天和朋友午飯時的聊天。朋友提到Facebook搞了個頁面,在這個頁面上可以下載自己所有的個人數據。你在Facebook上的所有活動,無論是點贊還是留言,都能一股腦兒下載下來。

這個挺有意思的!於是迪蘭就試了試。這個頁面很難找,不過迪蘭還是找到了,他試著下載了自己的所有用戶數據,然後一點一點的翻著。

用Facebook登錄過的App?嗯這個Facebook果然存著呢。我最近在Facebook上看過的視頻?沒想到這個Facebook也會存起來。

哎等等!這是什麼?為什麼我的所有通話記錄也被Facebook追蹤了?通話開始的時間、通話時長、通話者的名字,怎麼連這些Facebook都知道?我沒有用Facebook打電話啊!Facebook不是在盜取我手機的信息嗎?

紐西蘭小哥迪蘭·馬凱,發現Facebook追蹤了自己的通話記錄。

他立刻在推特上發了截圖,這條推特被轉發了四萬一千次。圖自網路

近來,越來越多的人發現自己下載下來的Facebook用戶數據,包含Facebook以外的個人信息。這個事情給最近隱私問題纏身的Facebook雪上加霜,「刪掉Facebook」 的話題標籤在推特上來了一輪又一輪,甚至有投資人考慮,是不是該讓扎克伯格辭職了?

等等,先別著急去Facebook公司門口舉牌子抗議。這個事情大家不覺得很蹊蹺嗎?Facebook一直在偷偷存著通話數據這事兒不假,但為什麼這個紐西蘭小哥迪倫,今年才突然發現自己被追蹤了呢?為什麼Facebook一方面要偷偷摸摸地監視著用戶的數據,一方面又要開放一個頁面,宣布它到底監視了你的哪些信息呢?這就像一個小偷,在夜裡一邊翻找著你家的值錢東西,一邊大聲喊:珠寶!現金!筆記本電腦!這些東西我可都拿走了啊!

一切的答案,都藏在一個大眾並不熟悉的名詞里。這個名詞,就是我們今天的主題——GDPR。

啥?啥叫GDPR?

GDPR 的全稱很枯燥,叫「通用數據保護規範」(General Data Protection Regulation)。雖然你可能沒聽說過它,但 Facebook、谷歌、亞馬遜等這些矽谷巨頭的老闆們,一聽 GDPR 就頭疼。這些公司的很多員工,一聽GDPR 就想哭。而很多歐洲的不少律師,一聽GDPR就會兩眼放光,賺錢的機會又!來!了!

GDPR 這個數據保護規範,到底有什麼神奇之處?

GDPR,其實就是2016年歐盟頒布的隱私法。這個規範包含下面幾個內容:

用戶自己的數據,必須可以隨時被自己查看、修改、刪除、下載

任何公司,必須在收集用戶數據之前,讓用戶簽一個協議

收集16歲以下兒童數據,必須經過家長同意

簡而言之,就是用戶的數據,控制權必須要在用戶手中。

這個法律,沒得說,每一條定得都特別有道理。比如數據查看權。如果Facebook 追蹤了我幾點起幾點睡,那我必須得知道。不然到了Facebook給我推送安眠藥廣告的時候,我都不知道為什麼。

還有數據修改和刪除權,我要是用谷歌搜索了「草榴網」、「脫衣舞俱樂部」、「優衣庫試衣間」什麼的,那我得有辦法給刪掉,不然我老婆翻我電腦的時候,我沒法解釋。

另外就是未成年人保護權,不能偷偷追蹤孩子玩兒的手機遊戲,然後天天給他推送「屠龍寶刀、點擊就送」。孩子自控力不高,又沒有經濟獨立,不能瞞著父母,從他們身上賺錢。

2016年立的法律,2018年5月25日才開始執行,歐盟還是很人道的!給各大公司兩年時間準備。但等 5 月 25 號一到,如果發現任何公司違反,那就重罰。要麼交 2000萬歐元,要麼交4%的營業額,哪個罰得多交哪個。

這個罰款,相當重!到底有多重呢?咱們舉個例子,谷歌在2017年的營業額是1096億美元,4%的營業額就是大概44億美元,夠谷歌買兩個Snapchat,或十個雅虎、或十四個Airbnb。

基本沒有公司敢跟歐盟犯橫,這個罰款金額實在太高了。

律師給互聯網公司的建議:保持冷靜,跟GDPR認慫吧

(https://www.hospitalitynet.org/opinion/4084533.html)

今天,隨著 Facebook 這一大堆用戶隱私的醜聞,美國的議員們也開始把目光轉向歐盟,希望在美國也搞一個類似的隱私法。有了歐盟的 GDPR、美國未來的隱私法,個人隱私問題會在全球法律上更完善、更多樣。這對互聯網產業的健康發展是非常有利的。

雷總您冷靜

任何立法都有爭議,GDPR 這麼偉大光榮正確的法律也不例外。首先最大的爭議就是:到底哪些數據是用戶數據,哪些數據不是呢?

很多人說這不廢話嗎,從我身上來的就是,別人身上來的就不是。這個時候,程序員就會扶一扶黑框眼鏡告訴你,事情沒有那麼簡單。

一個互聯網公司的數據,大概是下面這麼個模式:

這個圖看著太抽象,我們瞎編個例子:

小米CEO雷軍每天在北京上班,他裝了一個叫做「QQ天氣」的應用,每天早上醒來,都需要查一下北京是不是有霧霾、要不要戴口罩。雷軍每次打開QQ天氣,QQ天氣都會偷偷地給騰訊的數據中心發送這麼一條信息:「20XX年X月X日,用戶雷軍,在北京海淀區,查看了本地天氣。」

有時候雷軍也去一趟印度開個發布會,現場給印度粉絲們發一批小米手環。於是時不時也會查一下新德里的天氣。這些行為當然也被QQ天氣如實彙報給馬化騰了。每天QQ天氣給騰訊做的這個小報告,因為沒有進行過任何處理,所以叫做「數據生肉」。

日積月累,騰訊已經有五百多條關於雷軍的小報告了,這些小報告太多,於是騰訊做了一個簡單處理,把五百條小報告變成一句話:「雷軍在去年兩年內查看了523次北京天氣,23次新德里天氣。」這個數據因為不是直接從雷軍身上扒下來的,而是騰訊後台處理出來的,所以我們管他叫「數據熟肉」。

雷軍和印度粉絲們熱情交流,並用標準的英語表示問候

(http://mobile.zol.com.cn/560/5601897.html)

當然,騰訊不可能只追蹤雷軍,它肯定還會追蹤同樣使用QQ天氣的馬雲、劉強東、李彥宏。經過總結,騰訊發現,過去一年內,一共10萬人在北京使用了QQ天氣。「10萬」這個數字,並不是從某一個用戶身上總結過來的,而是多種數據共同推導而出的。所以我們管它叫做「衍生數據」。

數據熟肉和衍生數據,被騰訊一股腦地交給人工智慧 「騰訊小Q」。小Q看了看,覺得像雷軍這種經常去新德里的北京人,應該經常給他在手機上同時推送北京和新德里的天氣。於是人工智慧把這個給雷軍手機上的QQ天氣一說,QQ天氣立馬給雷軍發了兩條推送:一條北京的、一條新德里的。「北京今天重度霧霾,而且忒冷」、「新德里今天重度霧霾,但是vely vely hot」。

個人數據從收集,到處理,到歸納,到人工智慧,再到返回用戶,這就是互聯網公司最簡單的數據處理模式。任何使用人工智慧的互聯網公司,都有這些種類的數據,也都會採取這個流程。

咱們繼續講故事,雷軍有一天突然想把自己的數據都刪掉,於是給馬化騰打了個電話。「沒問題!」馬化騰說完掛了電話。但第二天,雷軍依舊收到了兩條推送:「北京今天終於晴了」、「新德里今天繼續霧霾」。

雷軍於是跑到馬化騰辦公室理論去了。

「你不是刪掉我的所有數據了嗎?為什麼騰訊還是知道我要去新德里?」 雷軍很憤怒。

「雷總請冷靜一下,」馬化騰不緊不慢地講,「我們確實把您手機每天發的小報告(數據生肉)都刪了,但您經常用QQ查新德里天氣這個習慣(數據熟肉),不是從您身上追蹤來的,而是我們騰訊總結出來的。」

「那也不行,只要和我有關的數據,你都得刪掉!你信不信我今天就把QQ註銷了?」 雷軍摔門而去。

第二天早上,雷軍又收到了QQ天氣推送:「北京沙塵暴,新德里今天還霧霾。歡迎註冊騰訊會員,獲得更多體驗!」

雷軍又找馬化騰去了。

「雷總,您冷靜一下。」馬化騰淡然自若的說。「儘管您註銷了QQ號,但我們發現,住在您家附近的人、您的家人、同事、朋友,都會經常去新德里跟隨出差。這個數據(衍生數據)不是您的數據,而是我們根據所有用戶分析出來的。這個您不能讓我們都刪掉吧?」

「少跟我來這套!」 雷軍已經出離憤怒了,「我讓所有小米員工,都註銷QQ號!我們全家人,都註銷QQ號!這樣你們就不能給我推送了吧?」

第三天早上,並不意外地,雷軍又收到了QQ天氣推送:「北京下雨了,新德里艷陽高照。歡迎註冊騰訊會員,獲得更多體驗!如果您讓您的家人朋友註冊騰訊會員,會獎勵Q幣哦!」

「這回你怎麼解釋?我辦公樓的全體員工都沒有QQ號了,我老婆孩子都戒了QQ了。你們為什麼還知道我是雷軍,我要去新德里?」雷軍揪著馬化騰衣領問。

「啊,對不起啊,」馬化騰笑了,「您原來的數據已經教會我們這個人工智慧小Q了。它……它給您的手機推送習慣了。」

騰訊小Q,騰訊的其中一個人工智慧

圖自 qrobot.qq.com

上面只是我編的段子,但由此可見,用戶個人數據這個邊界,其實特別模糊。數據熟肉算不算個人數據呢?熟肉的起源是生肉,但它是互聯網公司辛苦總結出來的,難道控制權不該給互聯網公司一部分嗎?衍生數據算不算個人數據呢?如果算的話,那我不就把我內部伺服器的原理都免費公開了嗎?利用你的數據訓練出來的人工智慧,算不算你的個人數據呢?如果算的話,每次你註銷賬號,我們都有把訓練出來的人工智慧給「殺死」嗎?

臣妾做不到啊!

咱們退一萬步講,就算個人數據這個邊界特別清晰,真正把數據的控制權交給用戶也不是一件容易事兒。

比如,我是個互聯網大V,我發了一個慈善組織的推廣微博,然後鼓勵大家捐款。大家紛紛在評論區留言,說一定支持,一定把鏈接分享出去。然後,我等到深夜沒人注意,偷偷把我的慈善組織的微博改成了一個網頁遊戲的廣告,把鏈接指向了「貪玩藍月」。結果第二天,微博用戶們發現我這個廣告下面全是「支持!」「非常有價值!」那這條微博,不就把原來寫評論的人給坑了嗎?這個時候,個人用戶數據是一種討論場景。一個場景的控制權,不能交給單獨一個人。

咱們再想一個場景:兩個 ISIS 恐怖分子用 WhatsApp 發信息,確定在哪裡搞爆炸。第二天,他們真的這麼幹了,造成了幾百人傷亡。FBI 找到了WhatsApp,說我們要這兩個人的聊天記錄。結果 WhatsApp 發現,ISIS這倆人早就把聊天記錄刪了,警方根本沒法追蹤到嫌犯。這個時候,個人用戶數據是一種嫌疑人證據。一個犯罪證據的控制權,不能交給兇手。

假設現在有這麼一個頁面,這個頁面可以查看、修改、刪除、下載我所有的個人信息,這多方便啊!問題是,黑客也是這麼想的。只要拿到你的密碼,他就可以在你發現之前,瞬間下載完你所有的銀行卡號、身份賬號、裸照等等。理想狀況下,個人隱私的控制權在自己手裡。可現實生活中,個人隱私的控制權很容易就流到了黑客手中。

2014年,黑客瑞安·柯林斯(Ryan Collins)盜竊了一眾好萊塢明星的裸照

「大表姐」詹妮弗·勞倫斯也是受害者之一

還有,不能追蹤16歲以下的孩子的個人數據,但這個執行起來實在是太難了。世界大多數國家,都沒有互聯網實名制。根本就不知道這個用戶到底是不是上網時候如實彙報了自己的年齡。一個在線觀看「色戒」的中年用戶頭像,屏幕後可能是10歲的孩子。一個「你是不是已經滿16歲」的對話框,完全不能避免一個孩子的數據被追蹤。家長協議也是槽點滿滿,我去哪兒找這孩子他爹的賬戶去?就算孩子提交了一個有他爹簽名的「家長同意書」,我作為互聯網公司怎麼知道這真是他爹,而不是隔壁王叔叔呢?

做這些隱私頁面其實並不簡單。像谷歌、Facebook、LinkedIn、亞馬遜,這些成立了近20年的互聯網公司收集了這麼多用戶數據,一下子讓他們都把這些數據給用戶還回來,臣妾實在做不到啊!很多創業公司,一共只有那麼幾個程序員,突然讓他們寫一大堆隱私頁面,會讓整個公司半年停擺。如果這些小公司到了5月25日這個截止日期,做不出隱私頁面,那就會被罰巨款。擔負不起怎麼辦?要麼滾出歐盟市場,要麼自己破產。

上有政策,下有對策

因為上面這些難點,互聯網公司想了各種各樣的對策,繞過種種隱私法。

最簡單的做法,就是讓用戶很難找到自己的隱私。比如我們開頭提到的紐西蘭小哥迪蘭,他就是找個各種犄角旮旯才找到自己在 Facebook 的隱私數據的。你必須得在主頁頂上點最右邊的小三角,然後進入隱私頁面,然後點下面的一行小字:「下載你的 Facebook 數據」。Facebook 還算良心,如果你去谷歌,就會發現谷歌的下載頁面更難找。它藏在谷歌的幫助頁面裡面,需要點三個犄角旮旯才能找到。憑著這個小花招,互聯網公司既能滿足法律要求(也就是必須要有隱私頁面),又能確保大多數人根本找不到這個隱私頁面。

Facebook的隱私頁面,藏在犄角旮旯里

第二種方法,就是百試不爽的「用戶協議」。彈出一個巨長無比的用戶協議,然後問你同意不同意。你只能點同意,不然上不了這個網。最近大家是不是都開始發現各種軟體、網站突然協議彈窗變多了?原因就是這個歐盟的 GDPR。

第三種方法,叫做「支付牆」(Pay Wall)。就是說,假如你不想被我們的網站追蹤,那就得每月給我們交錢。上面的雷軍如果不想讓馬化騰追蹤自己,那馬化騰有權說:「你必須每個月充Q幣、買黃鑽會員。」 每月交的錢,就像給黑社會的保護費。交過保護費以後,就像建了一堵「隱私牆」,Facebook、谷歌就不再追蹤你,也不會用廣告騷擾你了。

最近扎克伯格剛剛被美國國會質詢,一個參議員問小扎:「是不是以後我們把錢給Facebook,Facebook 才不追蹤我們的隱私?」扎克伯格並沒有立即否認,反而很委婉地說:「我們永遠都會有一個免費版的Facebook。」這話讓人聽完非常睡不著覺。因為扎克伯格很可能在暗示,免費版的Facebook會把你的隱私賣給廣告商。如果你不想讓我們賣的話,歡迎充「Facebook會員」啊!

還有一些方法就比較冷門了,比如刪賬號。如何應對16歲以下兒童的隱私保護呢?這個太棘手,所以有些公司會幹脆註銷掉所有孩子的網路賬號,刪掉所有他們的信息,以防信息泄露給廣告商,給自己招來麻煩。

當然這些對策都是 GDPR 法律邊界的試探,如果歐盟認為互聯網公司的「支付牆」、或者「用戶協議」並不合法,那麼甭管你是 Facebook 還是谷歌,都得乖乖交罰款。

個人隱私和「數據啟蒙運動」

我們在這裡講 GDPR,並不想解釋一個枯燥的法律,或者譴責某個互聯網公司濫用隱私。我想借著隱私立法的契機,講一個社會運動——數據啟蒙運動。

最早註冊 Facebook 的那一批人,根本不會想到 Facebook 會背叛他們、販賣個人隱私。因為互聯網時代是免費的、是公開的、是嘗鮮者的樂園。互聯網時代也是快節奏的,它可以迅速淘汰掉弱者,迅速推翻前一個巨頭。在這些互聯網公司咿呀學語的時候,都是懵懂無知的理想主義者:扎克伯格並不想在Facebook上放廣告,拉里·佩奇只想做一個簡單的網頁搜索,楊致遠想把雅虎變成一個互聯網門戶,陳士駿只想把 YouTube 變成人們分享小視頻的廣場。

Facebook、谷歌、雅虎,它們最早都不是廣告公司,但都想不出更好的賺錢辦法。於是創業者們發明了一種完美的模式——免費模式。用戶註冊免費,但個人數據會被網站追蹤,用來推送廣告。因為註冊是免費的,所以Facebook、谷歌這樣的公司用戶量會出現暴增,可以迅速成為霸主。個人數據是無窮無盡的,只要認真挖掘,一定能賣個好價錢。

在免費模式里,你和我都不是Facebook的客戶,而是Facebook的產品。我們的隱私數據生肉會被 Facebook 煮成熟肉,打包賣給出價最高的廣告商。可用戶的增長如果達到了飽和怎麼辦?那就從已有的用戶身上挖掘更多的數據,用更高級的工具做出更細緻的分析,賣給更多的廣告商。

360創始人周鴻禕推崇「免費模式」

2018年,360快視頻盜取了B站大量賬號和視頻,

可以說是把「免費模式」做到了走火入魔

我們今天看到,大數據非常火爆,數據分析師年薪十萬美元,道理就在這兒。互聯網公司像從奶牛身上擠奶一樣,從用戶身上「擠」數據。然後數據工程師用 Kafka、Storm、Hadoop、Spark 這些外行人根本沒聽說過的工具,把數據生肉處理成熟肉。數據分析師仔細地把用戶數據整理歸類,然後給廣告商端出來。一個谷歌的前部門經理曾說過,谷歌的核心競爭力不是搜索或者安卓,也不是地圖或者日曆,它的競爭力是能把用戶數據變成錢(「User Data Monetization」)。「把用戶數據變成錢」,這才是免費模式的背後邏輯。

可隨著Facebook隱私醜聞的爆發,人們越來越意識到,泄露個人網路隱私是危險的。這種個人隱私的覺醒,會帶來一場「數據啟蒙運動」。它會推動各國隱私立法,讓Facebook、谷歌這樣的互聯網公司獲取用戶數據的成本越來越大。

在未來幾年,我們會看到越來越多像GDPR這樣的隱私法出台,也會看到越來越多的「扎克伯格」們出庭作證。如果谷歌想做一款新的應用,那一定要考慮這個應用會不會泄露用戶隱私。Facebook 想搞新的交友工具,那也得先徵求用戶每個人的意見。

免費模式帶來的野蠻商業生長,會因此逐步放緩。互聯網公司僱傭的那些數據工程師、數據分析師、人工智慧科學家們,也有可能也會越來越少,越來越沒有繼續挖掘用戶數據的動力。

隨著「隱私啟蒙運動」的興起,大數據時代下的免費模式,會不會成為歷史呢?

特約作者:屈直

屈直,雅虎軟體工程師。深入分析,大膽預測,敬請關注 「矽谷直說」。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 矽谷密探 的精彩文章:

完美的扎克伯格,倒霉的Facebook
報告女王陛下,我找到了可以吃的塑料杯!

TAG:矽谷密探 |