當前位置:
首頁 > 最新 > 志偉源代碼:看似毫無關聯的事件,內里卻萬千糾葛,比如臉書醜聞、劍橋分析公司和特朗普美國大選……

志偉源代碼:看似毫無關聯的事件,內里卻萬千糾葛,比如臉書醜聞、劍橋分析公司和特朗普美國大選……

主講人:馬志偉

馬志偉,美國耶魯大學統計學博士、唯你網聯合創始人及首席風險官。25年金融行業實戰經驗,是大數據及人工智慧在數據金融及產業應用的專家和實踐者,參與創立多家FinTech和大數據公司。先後任職美國花旗銀行助理副總裁,美洲銀行副總裁,AIG亞太區副總裁,AIA集團副總裁,唯你網聯合創始人及首席風險官等。曾為多家主流金融機構提供諮詢,擔任香港大學中國商學院客座導師,是互聯網金融千人會核心成員。

「智能科技+」背景

Facebook臉書的數據醜聞,在美國影響非常大。美國目前已經把這個事件叫做data scandal。很多媒體的報道也非常聳人聽聞,說它可能會被罰20000萬億的罰款,遠遠超過它本身的市值。最近,非常多名人和公司也參與了所謂的delete Facebook的行動,刪除上面的賬戶。它的股價也跌了幾百億,將近1000億美金的市值。所以本身這是一個非常大的事情。對未來數據怎麼應用、怎麼獲取、怎麼立法和大數據以及人工智慧大發展肯定會產生很大影響。

在這一期中馬志偉先生「智能科技+」作為主題,通過分享和剖析具體的應用和案例,希望能幫助大家對這些科技有更深入地理解,同時也許會對大家的工作或其他方面有一定的啟發。

寫在前面

臉書數據醜聞是一個標誌性的事件。其實這個事件本身它有兩面性:

由於本身的這個事件,它應用在了比較敏感的一個領域,就是政治上面,競選。幫助特朗普在競選中起到了一定的作用。所以引起了一些公眾的恐懼感,這肯定會帶來很多數據安全和數據立法上面的一些變化。

但從另外一個角度來講,其實這件事情本身也讓公眾和我們傳統商業社會、企業對技術本身的傳播,讓公眾的認知可能還是一件好事。今天我希望通過這個時間,給大家來刨析一下,這個過程它背後到底是用到了什麼樣的技術,為什麼我們通過這些可以對這麼重要的一些,比如政治上的競選這樣的事件產生這麼大的影響。

臉書醜聞主角:劍橋分析

我們談論的Facebook醜聞中一個主要的角色是英國的一家叫「劍橋分析」(Cambridge Analytica)的公司。

劍橋分析與特朗普大選

之前這公司其實名不見經傳,但在特朗普當選之後不久,有過媒體對這家公司有過報道,說它對特朗普的當選其實起了很重要的作用。他們自己也在自己的網站上也發布了一個消息「特朗普大獲全勝,我們革命性的數據驅動型傳播在其中扮演了不可或缺的角色,我們為此激動萬分。」當時這些事情並沒有引起過多的關注。在AI領域其實大家更多的把它作為一個應用的成功案例分享。

MyPersonality一石激起千層浪

整個事件最初是劍橋大學的兩個研究心理學的學者,他們當時在Facebook上開發了一個小應用——MyPersonality(我的性格),其實很類似我們現在在微信上的一些小程序。

小應用獲取用戶數據

它其實很簡單,通過應用,填寫一些心理測驗。通過問卷, MyPersonality可以評估,把你的性格分成五個維度,每個維度都有分值。輸出一個類似5維性格雷達圖。這類心理測驗在社交媒體,比如Facebook、微信上非常常見,在社交平台上還有更多小遊戲,通過這些來獲取你的用戶的一些行為和數據。不但在國外的facebook,在國內的微信都常常見。通常你再用的時候,他會問你,是不是同意授權他把你Facebook個人主頁的數據分享給研究人員,分享給應用,讓他可以看得到。這個是非常常見的一種做法,大家也樂於參加這樣的一個遊戲。

心理學理論支持數據收集

我們剛才提到MyPersonality,你做完以後他給你輸出一個五維的雷達導圖。為什麼是五個性格維度?這背後有一個心理學很知名的理論——上世紀80年代心理學家開發了一種模型,叫做「五大性格特質」。

開放性(你對新的經驗有多開放?)

盡責性(你有多完美主義)

外向性(你有多合群?)

親和性(你有多體貼、多願意配合?)

神經過敏性(你有多容易不開心?)

每個特性用一個字母來表示

叫做O,C,E,A,N統稱「OCEAN」

就是海洋的意思

MyPersonality主要在facebook實踐里的應用其實它背後就是用了OCEAN的模型來給大家做一個性格的評估。但是在過去,這個模型沒有被廣泛應用很大的原因就是數據很難收集。因為收集數據需要讓調查參與者填一份涉及很多隱私的問卷。這個其實很多人不願意參與。但是有了互聯網之後,收集數據以這種遊戲的形式來做這樣的事情,就可以做了,這就是為什麼MyPersonality要運用到Facebook上得以非常成功的收集了大量的數據的一個原因。

別有用心的大數據泄露

小程序MyPersonality在社交網路上很容易的傳播。很多人不會關注其風險。所以MyPersonality在Facebook上推出後,通過營銷和激勵,再加上這個事情一開始確實是和Facebook通過官方渠道合作的,所以沒有太多人會很多的顧慮。當時很快就有27 萬人參與。不但收集了這27萬人的數據,同時,Cambridge Analytica也通過小程序還收集了這27萬人朋友圈過程中朋友的主頁信息、評論及點贊信息。通過這27萬人,直接獲取了超過5000 萬個用戶的數據。它獲取了一個巨大的數據集,這個數據里包含參與者的一些性格以及他們在Facebook上的社交行為。

當時他們在做這個事情和Facebook簽訂協議的時候,是以學術研究的名義,實際上 Facebook 在審核過之後來通過。只是Facebook現在遇到的問題是這個之後數據被用於了其他的目的,特別是最後拿這個東西去操縱了輿論的風向,幫助特朗普競選。這些事情,Facebook或者他不知道,或許他知道卻並沒有繼續把關,所以就引起了這麼大的反響。現在就變成了Facebook的問題。

Cambridge Analytica獲取了這些數據之後,他們通過這個數據首先他能計算出這些人的五大性格特徵,然後他把這些結果和這些人網路上的各種行為放在一起,包括標明的性別、年齡、住址。這樣一來它就可以把性格和你的網路上的一些行為和其他的信息來對應起來。通過這個建立學習的模型,最終可以達到,通過這個模型可以預測一個人的性格。通過這套演算法,可以做出相當準確,對人的很多的性格,包括趨向做出相當準確的預測。

通過機器學習的模型,可以找到量化之間的關聯。這就是一個非常powerful的工具:單獨來看一個人,用這種模型來預測,本身他沒有什麼價值。但一旦將成百上千的個人數據整合起來,預測結果就會很準確。後來CA團隊不斷完善他們的模型,到2012年,通過數據證明,基於一名Facebook用戶的68個「贊」,該模型可以預測出用戶的膚色(準確率95%)、性取向(準確率88%),以及該用戶是支持民主黨還是共和黨(準確率85%)。用戶的智力、宗教信仰,以及煙酒、毒品的使用情況,都可以被預測出來。通過這些數據,它甚至最終能憑藉Facebook上的十個「贊」,賽過某個人身邊同事對此人的了解; 150個甚至贊賽過父母對此人的了解。簡單來講,可以通過獲取的數據來預測人們的智商、政見、信仰、是否相信星座、興趣愛好。

劍橋分析的獨到之處

劍橋分析的獨到之處作用於選舉

劍橋分析它的獨到之處是把大數據、社交數據和五大性格特質(OCEAN)模型通過機器學習技術結合起來,進而精準量化人們的性格特質,從而實現精準的定向傳播,CA自己總結自己的核心就是:OCEAN模型、大數據分析、定向廣告。

所以通過這個模型以及他們有獲取合法的很多其他的數據之後,他們聲稱「美國2.2億成年人,每個人的性格風貌都被我們勾勒了出來。」這是一個非常可怕的事情。他講的這個本身有一點誇張,但確實是非常強大。相當於它有了一個人肉搜索引擎。

有了這樣一個強大的武器,它就應用到競選上面,引用劍橋分析的CEO的話,他說:

特朗普傳達出的每一條訊息都是由數據驅動的。在特朗普和希拉里展開第三場總統辯論時,其競選團隊就拿他的基本立場,在Facebook上測試了17.5萬個不同的廣告版本,以找到最合適的版本。不同版本的差別大多都只是細節,如標題、顏色等,或加照片,或附視頻,但這樣可以有針對性地,將心理影響的效果最大化。這樣的微調一直精確到最小的群體。我們可以對一個村莊或小區,乃至一個個人,進行有針對性的宣傳。

比如在邁阿密的小海地,特朗普競選團隊就向當地居民宣傳:海地地震之後,柯林頓基金會是如何行動不力。這樣就斷了他們給希拉里投票的念想。這就是他們的目標之一:讓潛在的希拉里支持者(包括搖擺不定的左翼人士、黑人,以及年輕女性)放棄投票。這些Facebook廣告帖又稱「暗帖」(dark posts),只有符合具體特徵的用戶才會看到一些什麼樣的廣告。通過這樣的形式,影響到不同的選民。

最終它對競選的產生了具體多大的影響,其實很難精準量化,但結果是特朗普贏了,它確實起到了一定的作用。單純從科技角度看,是大數據和機器學習的一個很好的案例,通過這麼一個競選實戰的事情,把數據和演算法的價值確實得到了充分驗證。當然未來如何以更嚴謹的方式獲取數據,應用到合適的場景下,合法的形式可以有巨大的想像空間。最近斯坦福的一些研究證明,若將產品和營銷信息跟消費者的性格特質相匹配,營銷者最多可增加63%的點擊量和1400多條對話。所以通過性格定向的威力確實非常大。

劍橋分析暴露的弊端

當然另一方面,我們通過這件事情也暴露了許多數據安全及個人隱私保護方面的問題。至少給現在所有的比如Facebook還有所有的社交媒體都帶來了很大的影響。所以這個事情未來一定會促使立法對數據的應用、數據的獲取會有更多的一些規範。同時由於這個事情讓很多大眾對數據有一定的恐懼感,未來會不會有很多人不願意分享數據,會不會對我們整個大數據和人工智慧帶來一些影響,至少會帶來一定的挑戰。所以未來肯定還要拭目以待。

但不管怎麼樣,未來數據會越來越多、越來越精準、越來越智能的被應用在人類生活的方方面面,這是一個大的趨勢。只是說如何用、用在什麼地方,需要更謹慎,更合法的形式來做。但它的價值,它未來的趨勢是不可改變的。

關於道來

誇客優富推出首檔咨訊文化傳播欄目,每期一位業界大咖,帶領他的朋友或其團隊成員就其專業領域或熱點話題「娓娓道來」,以音頻或視頻的互動模式,跟粉絲分享個人心得或熱門觀點。每周一期20分鐘交流,不定期5分鐘時事分享,通過「講故事」化「深度為簡單」,通過「述新知」化「枯燥為睿智」。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 優富尊享 的精彩文章:

買齊《頭號玩家》里的酷炫裝備,居然……一!點!都!不!貴!拿去裝X,收好不謝!

TAG:優富尊享 |