當前位置:
首頁 > 最新 > 大數據安全白皮書解讀

大數據安全白皮書解讀

本公眾號的推送以互聯網大數據技術為主,其特色為原創性、技術性。以前部分推送:

...

一. 大數據安全的問題

信通院將大數據安全分為了平台安全、數據安全和隱私保護三個層次,自下而上為依次承載的關係,以大數據平台為基本出發點,形成了大數據安全總體視圖。

但是從大數據安全整體的角度看,最上層只包含隱私保護有點不完整。數據的上層是語義,相應的安全是屬於內容安全。除了隱私問題外,輿情信息、社交媒體內容等安全問題都應歸入這個層次。

二. 什麼是大數據安全

第一類是大數據帶來的風險問題:

這種風險是指大數據被收集、挖掘後導致的安全風險,通常表現為語義上的安全,就是內容安全。這與國家的「11種安全」(政治安全、國土安全、軍事安全、經濟安全、文化安全、社會安全、科技安全、信息安全、生態安全、資源安全、核安全)密切相關。

比如,白皮書中提到了美國一款健身應用軟體將用戶健身數據的分析結果在網路上公布,結果涉嫌泄露美國軍事機密。這款軟體名為斯特拉瓦,是一款集健身和社交功能為一體的應用。用戶可以將自己運動時間、成績、軌跡等信息通過網路上傳至應用伺服器,與他人分享。然而,由於不少美軍現役軍人在使用這款應用,許多美軍基地的地理位置因此在熱力圖上清晰地顯現出來。大量軍事基地方位遭曝光,引發各界關注。

第二類是大數據平台自身的安全問題:這與現在人們常說的安全問題比較接近,包括了竊取數據、癱瘓系統、系統入侵等等。大數據平台安全是對大數據平台傳輸、存儲、運算等資源和功能的安全保障,包括傳輸交換安全、存儲安全、計算安全、平台管理安全以及基礎設施安全。

第三類,為了區別於傳統數據安全的提法,我把它稱為數據操縱風險。由於大數據分析挖掘結果會直接被用來指導各種活動,比如制定客戶優惠體系、發現優質客戶等等,因此競爭對手可以通過應用系統製造惡意數據,產生雜訊數據,從而導致大數據分析結果產生偏差

大數據安全問題的解決無法在傳統安全的框架中進行,需要從「大安全」的視角認識和解決大數據安全問題,打破傳統的重技術的安全保護思維模式,建立涉及經濟、法律、技術等多角度全方位的大數據安全保障體系。

三. 大數據安全面臨的一些挑戰性技術問題,這些問題,可以作為研究生選題的一些思考方向,主要有:

1、大數據平台在 Hadoop/Spark開源模式下缺乏整體安全規劃,自身安全機制存在局限性

2、大數據平台服務用戶眾多、場景多樣,傳統安全機制的性能難以滿足需求

3、大數據平台的大規模分散式存儲和計算模式導致安全配置難度成倍增長

4、針對大數據平台網路攻擊手段呈現新特點,傳統安全監測技術暴露不足

5、數據泄露事件數量持續增長,造成的危害日趨嚴重

6、數據採集環節成為影響決策分析的新風險點 :目前尚無嚴格的數據真實性、可信度鑒別和監測手段,無法識別並剔除虛假甚至惡意的數據,最終容易雜訊數據操控。

7、數據處理過程中的機密性保障問題逐漸顯現

8、數據流動路徑的複雜化導致追蹤溯源變得異常困難

9、傳統隱私保護技術因大數據超強的分析能力面臨失效的可能

10、傳統隱私保護技術難以適應大數據的非關係型資料庫

作者編著的《互聯網大數據處理技術與應用》專著(清華大學出版社,2017)、同名公眾號,專註於大數據技術的相關科學和工程知識傳播,同時也為讀者提供一些拓展閱讀材料。歡迎選用本書做大數據相關專業的教材,有相關教學資源共享。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |