當前位置:
首頁 > 新聞 > 深度解密:美國近2億選民身份信息泄漏始末

深度解密:美國近2億選民身份信息泄漏始末

事件概要

近日,UpGuard公司網路風險小組的研究人員發現了一個錯誤配置的資料庫,其中包含超過1.98億美國選民的敏感個人資料。而此次泄漏事件正是由為共和黨全國委員會(Republican National Committee,簡稱RNC)提供數據分析和服務的Deep Root Analytics公司所造成的。據悉,這1.1TB的數據就存儲在Deep Root Analytics公司一個可公開訪問的亞馬遜雲伺服器上,沒有密碼保護,任何人都可以訪問。

這1.1TB的數據共計包含近2億選民的個人信息,除了姓名、出生日期、家庭地址和電話號碼等信息外,這些記錄還包括政治團體採用的先進情緒分析來預測個人選民如何處理熱門問題,如槍支所有權、幹細胞研究和墮胎權、以及宗教信仰和種族等。

此次數據泄漏事件的影響遠遠超出之前的墨西哥和菲律賓選舉數據泄漏案,已經危害了美國61%的公民的個人信息安全。

根據曝光的數據,我們可以更深入地了解大數據在美國總統大選中發揮的重要作用。RNC通過利用Deep Root Analytics、TargetPoint以及Data Trust公司的大數據分析技術來影響潛在選民並準確地預測其行為。

發現過程

6月12日傍晚,UpGuard網路風險分析師Chris Vickery(墨西哥選民數據泄漏也是他發現的)在代表網路風險小組(UpGuard公司的研究團隊,致力於尋找、保護和提升公民對此類安全事件的認知)搜索配置錯誤的數據源時,發現了一個開放的雲存儲庫。

該數據存儲庫(Amazon Web Services S3 bucket)沒有任何保護措施,因此,任何有互聯網連接的人,只需要導航到包含6個字元的亞馬遜子域名:「dra-dw」中就可以訪問這一幫助特朗普贏取勝利的共和黨資料庫。

在檢查內容時,我們發現「dra-dw」其實就是「Deep Root Analytics數據倉庫」。「數據倉庫(data warehouse)」的概念在現代企業中很常見——實質上,它是專門為複雜分析而準備的大規模數據集。Deep Root Analytics公司證實稱,他們擁有並運營該dra-dw bucket。

分析發現,該「數據倉庫」中共有1.1TB的數據——大約相當於500小時的視頻數據,且都是完全能夠下載的。這些文件清楚地表明了該資料庫的政治重要性,因為文件的目錄都是以一些有影響力的共和黨政治組織命名。

但這1.1TB的數據並不是全部,「數據倉庫」中還有24TB的數據,但是已被安全配置為「防止公共訪問」。最終,存儲在錯誤配置的資料庫中的數據量相當於大約100億頁文本的大小。

目前,我們不太清楚那些不可訪問的文件的政治重要性,例如名為「for_strategy_xroads_updated_FINAL」的文件,在某種意義上可能指向的是「美國十字路口(American Crossroads)」——目前全美規模最大的super PAC,由小布希總統的政治顧問、「籌款神童」Karl Rove聯合創建,在2016年的選舉融資中表現非常活躍。此外,我們還發現了緩存的Reddit帖子,保存為文本:

6月12日-14日期間,Vickery下載了這1.1TB的可公開訪問的文件,其中包含兩個名為「data_trust」和「target_point」的關鍵目錄。

操作過程

Deep Root Analytics是一個共和黨的數據公司供應商,由Alex Lundry(共和黨數據科學家,在2012年Mitt Romney參與總統競選時擔任數據總監)於2013年創建成立。該公司聲稱能夠通過大數據分析「微目標定位(microtargeting)」,更有效地實現人口統計,從而幫助客戶在購買廣告時作出更明智的決策。此外,它還為公司、遊說團體和GOP政治運動提供數據分析服務,力求實現針對特定目標的人口統計。

不過為了贏得選舉,共和黨還需要其他數據分析公司提供數據資源,其中一家就是Data Trust——一家位於華盛頓的數據諮詢公司,該公司的策略是為共和黨打造一個每名競選人都能適用的公用數據池。

在Deep Root Analytics資料庫中,有一個名為「data_trust」的文件夾,其中主要包含兩個文件存儲庫——2008年總統大選的256 GB文件夾和2012年的233 GB文件夾,每個文件夾包含51個文件——每個州都有一個,包括哥倫比亞特區。

Vickery發現了如下電子數據表,確認這些文件包含精確而又敏感的個人信息,以下列出的是.csv格式:

"RNCID", "RNC_RegID", "State", "SOURCEID", "Juriscode", "Jurisname", "CountyFIPS", "MCD", "CNTY", "Town", "Ward", "Precinct", "Ballotbox", "PrecinctName", "CD_Current", "CD_NextElection", "SD_Current", "SDProper_Current", "SD_NextElection", "SDProper_NextElection", "LD_Current", "LDS_Current", "LDProper_Current", "LD_NextElection", "LDS_NextElection", "LDProper_NextElection", "NamePrefix", "FirstName", "MiddleName", "LastName", "NameSuffix", "Sex", "BirthYear", "BirthMonth", "BirthDay", "OfficialParty", "StateCalcParty", "RNCCalcParty", "StateVoterID", "JurisdictionVoterID", "AffidavitID", "LegacyID", "LastActiveDate", "RegistrationDate", "VoterStatus", "PermAbs", "SelfReportedDemographic", "ModeledEthnicity", "ModeledReligion", "ModeledEthnicGroup", "HHSEQ", "HTSEQ", "RegistrationAddr1", "RegistrationAddr2", "RegHouseNum", "RegHouseSfx", "RegStPrefix", "RegStName", "RegStType", "RegstPost", "RegUnitType", "RegUnitNumber", "RegCity", "RegSta", "RegZip5", "RegZip4", "RegLatitude", "RegLongitude", "RegGeocodeLevel", "RADR_LastCleanse", "RADR_LastGeoCode", "RADR_LastCOA", "ChangeOfAddress", "COADate", "COAType", "MailingAddr1", "MailingAddr2", "MailHouseNum", "MailHouseSfx", "MailStPrefix", "MailStName", "MailStType", "MailStPost", "MailUnitType", "MailUnitNumber", "MailCity", "MailSta", "MailZip5", "MailZip4", "MailSortCodeRoute", "MailDeliveryPt", "MailDeliveryPtChkDigit", "MailLineOfTravel", "MailLineOfTravelOrder", "MailDPVStatus", "MADR_LastCleanse", "MADR_LastCOA", "AreaCode", "TelephoneNUm", "TelSourceCode", "TelMatchLevel", "TelReliability", "FTC_DoNotCall", "PhoneAppendDate", "VH12G", "VH12P", "VH12PP", "VH11G", "VH11P", "VH10G", "VH10P", "VH09G", "VH09P", "VH08G", "VH08P", "VH08PP", "VH07G", "VH07P", "VH06G", "VH06P", "VH05G", "VH05P", "VH04G", "VH04P", "VH04PP", "VH03G", "VH03P", "VH02G", "VH02P", "MT10_Party", "MT10_GenericBallot", "MT10_Turnout", "MT10_ObamaDisapproval", "MT10_Jobs", "MT10_Healthcare", "MT10_SoCo", "PG01", "PG02", "PG03", "PG04", "PG05", "PG06", "PG07", "PG08", "PG09", "PG10", "PG11", "PG12", "PG13", "PG14", "PG15", "PG16", "PG17", "PG18", "PG19", "PG20", "PG21", "PG22", "PG23", "PG24", "PG25", "PG26", "PG27", "PG28", "PG29", "PG30", "PG31", "PG32", "PG33", "PG34", "PG35", "PG36", "PG37", "PG38", "PG39"

文件中包含了選民的姓名、出生日期、家庭住址、電話號碼、註冊黨派、自述的種族以及選民登記狀態,還包括政治團體採用的先進情緒分析來預測個人選民如何處理熱門問題,如槍支所有權,幹細胞研究和墮胎權,以及宗教信仰和種族等。

「data_trust」中還包含一個關於2016年選舉的較小的文件夾,與2008年和2012年的文件夾不同,2016年的文件夾中只包含俄亥俄和佛羅里達州的.csv文件,可以看出這兩個是最重要的戰場。需要注意的是,整個「data_trust」文件夾可以被任何訪問該資料庫的人任意下載。

除了「data_trust」,資料庫中還有一個名為「target_point」的文件夾。TargetPoint是一家總部位於弗吉尼亞州亞歷山大市的「全方位市場研究和知識管理公司」,專門針對企業和政治客戶進行「微目標定位(microtargeting)」的關鍵人口統計,曾在2008年Rudy Giuliani參加總統競選、2008年McCain/Palin運動以及全國共和党參議院的連任活動中發揮重要作用。

TargetPoint 的聯合創始人Alexander Gage曾擔任總統候選人Mitt Romney的策略總監,他表示,

微目標定位(Microtargeting)正試圖揭開選民的政治DNA,掌握的信息越多,效果就會越好。

在「target_point」文件夾中,有以Alteryx資料庫格式(.yxdb,專為大規模數據分析設計的文件格式)保存的14個文件,大多數文件的最後更新日期在2017年1月中下旬,其中有幾個標記為「聯繫人文件(Contact File)」,不同的日期表示更新時間。 該文件夾與上述的「data_trust」文件夾一樣,沒有任何安全保護,任何人都可以進行訪問下載。

分析還發現,RNC的主要數據承包商除了Data Trust、TargetPoint Consulting、以及Deep Root Analytics外,還包括Causeway Solutions公司,它們通過一家名為「Needle Drop」的子公司與RNC進行合作。據悉,RNC支付資料庫中提到的兩家公司——Data Trust和TargetPoint的資金總額已經超過了500萬美元。

根據聯邦選舉委員會的報告顯示,2015年1月-2016年11月期間,RNC已經向TargetPoint公司支付了420萬美元的數據服務費,向Causeway支付了50萬美元。另外,還支付了Deep Root公司983,000美元。

總結

此次數據泄漏事件再一次引發了美國公民對其最特權信息的隱私和安全性擔憂。美國選舉進程的完整性已經被一系列針對國家選民資料庫的網路攻擊行為所破壞,這進一步引發了民眾恐慌,不得不承認的是,網路風險確實會對一個國家的民主和政府機構構成威脅。

如此龐大的國家資料庫可以在線創建和託管,即使是進行了安全配置一樣會令人不安。這種收集大量個人敏感數據並將其存儲在不安全的資料庫中的行為,也進一步刺激了民眾對於私營企業和政治運動的問責浪潮。

隨著對於技術的依賴性進一步增加,以及數字平台的加速部署,網路風險面也在不斷增長。除了黑市上的身份盜竊、欺詐和轉售泄漏數據外,數據分析能力還可以被應用於其他更多途徑——市場營銷、垃圾郵件以及高級政治目標等。如果利益相關者可以遵循收集和存儲數據的一些簡單規則,就可以防止這些潛在的私人信息濫用現象。

這些泄漏數據揭露的根本問題並不罕見,大數據對選舉的重要意義大家應該都略有了解。但是,現在我們要知道的是誰該為此次泄漏事件負責——被遺忘的資料庫、第三方供應商風險、不當的許可權,結合RNC的競選操作共同製造了這場幾乎前所未有的數據泄漏案。

雖然這場泄漏事件造成了非常深遠的影響,但是如果所有平台上的網路彈性(cyber resilience,也稱為運維彈性,是指網路在遇到災難事件時快速恢復和繼續運行的能力)精神不能夠成為所有面向互聯網的系統的通信語言的話,未來還將發生更為嚴重的泄漏事件,造成更具破壞性的影響。

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 嘶吼RoarTalk 的精彩文章:

Erebus以Linux勒索軟體的方式重出江湖,勒索韓國公司100萬美元
基於USB armory 製作一個USB惡意軟體分析器
英國軍工巨頭BAE將大規模尖端監控軟體Evident售往中東
惠普印表機爆遠程命令執行漏洞,黑客可任意操縱你的印表機
強大的內網域滲透提權分析工具——BloodHound

TAG:嘶吼RoarTalk |

您可能感興趣

美國民調:31%選民擔憂5年內發生內戰
3月18日臨近,全俄羅斯開始禁止發布有關大選民調和預測結果
重磅!歐盟選舉剝奪英國公民投票權,300萬選民徹底炸鍋…
2016年美國選民40%沒投票!6日中期選舉,44%僱主放假
為了討好選民,美國財政赤字2019年將達到9810億美元
1.93億選民投票全靠人工數 印尼大選累死272人
澳大多選民認為移民太多 望削減短期工作簽 55歲以上選民要求最強烈
中期選舉選民熱情火爆,已投出2800萬張選票超4年前
3500萬選民信息暗網標價出售 更可怕的是…
調查顯示:印度選民中有6500萬女性失蹤,女性的意願難以體現
把美國加州拆分成三個州?選民或可在11月對此投票
波羅申科支持率僅為17.4% 近50%選民明確表示不選他
美國民意調查:黑人選民對特朗普的支持率幾乎翻了一番,達到36%
投票進行中!為吸引120萬華裔選民,土澳各黨候選人「拼了」!
外報:美多數選民盼縮合法移民數量 國會迎挑戰
2020大選民調結果外泄!受傷的郭台銘將脫党參選?
近60%選民棄票讓美國找到武力介入借口!美國不承認馬杜羅合法性!
泰國將於24日舉行大選 預計選民投票率創歷史新高
卓榮泰當選民進黨主席 投票率16.9%創新低
2020年美國大選民主黨首場辯論開跑,候選人批特朗普關稅政策傷害普通美國人