當前位置:
首頁 > 新聞 > 通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

選自GitHub

作者:Roei Schuster等

機器之心編譯

參與:李澤南、Smith、吳攀


深度學習在數據特徵識別上的能力強大,目前已成為計算機視覺、圖像處理、語音識別、自然語言處理等領域的流行方法。最近,研究人員又嘗試將深度學習應用到了網路攻擊中。利用視頻流量分析,以色列特拉維夫大學和康奈爾大學的研究者們開發的新演算法只需在電腦或手機瀏覽器中加入幾行 JavaScript 代碼,就能在這台設備連接到 Wi-Fi 後通過流量數據識別出用戶觀看的視頻內容,而識別準確率接近 100%。

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

電視劇《黑鏡》中的又一項技術被科學家們部分實現了

目前,研究人員的演算法已經可以識別目標用戶在 Netflix、Youtube、亞馬遜視頻等平台上觀看的視頻內容,他們可以通過網路在遠程完成這項工作,只需用戶(或者相同區域網內的其他用戶)瀏覽經過適當製作的網站。這種方法無需直接訪問食品本身,也不用訪問正在播放視頻的設備,研究人員表示,從路由器、網路服務供應商到網站都可以通過這種方式窺探人們的隱私。

論文:Beauty and the Burst: Remote Identification of Encrypted Video Streams

論文鏈接:https://beautyburst.github.io/beautyburst.pdf

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

美是在觀察者眼中產生的,因此,為了獲得我們觀察到的東西,我們需要四處搜集我們所喜愛的東西。時至今日,很多我們觀察到的東西是以互聯網上的視頻形式出現的,而且我們對電影、電視節目、新聞、社交媒體視頻的選擇往往揭露了我們的個性、喜好、社會經濟狀況和心情。很多機構都渴望開發這些信息:廣告商家、保險機構、定價商或者去懲罰那些訪問不良信息的人。

網路傳輸加密技術給這些監控設置了障礙,但是我們知道網路傳輸分析,只能檢查網路傳輸的規模和時序,而對於傳輸的內容,通常需要進行歸納分析。怎樣對加密的視頻進行有效的流量分析?對於潛在的對手而言,這又有多容易呢?

我們提出了一種非常有效的方法,它有關攻擊者(attacker)如何用直接和間接的方法對目標用戶觀看的視頻內容進行分析的(通過像 Netflix 和 YouTube 這樣的流媒體)。我們考慮了三類攻擊情景:

路徑攻擊(On-path attacks),最簡單的方法,包括一個可以被動監控用戶流量的對手。這包括互聯網服務供應商,惡意 Wi-Fi 接入點、代理、VPN、路由器等。它們可以對完全精確地看到單個數據包,並且通過我們的方法,它們可以辨認出用戶正在觀看的加密視頻是什麼。

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

跨站攻擊(Cross-site attacks),攻擊者的唯一一次訪問就是通過受害者的瀏覽器來發送 javascript 代碼(如下圖)。這是一個相當危險的方法:現在,那些對用戶訪問習慣有著濃厚商業興趣的操作者無處不在,那些不受信任的 Javascript 代碼通常出自他們之手。瀏覽器可能會在一個被限制的環境中運行這些代碼,來防止其搜尋個人信息。但我們的研究展示了這種限制是失敗的:攻擊者可以通過一個旁路通道(side channel)來訪問網路視頻傳輸:他會用自己的數據來沖毀網路連接,然後在網路阻塞的時候去測量其波動。幾分鐘後,他們就可以對視頻進行推斷性的分析。

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

跨設備攻擊(cross-device attacks):這是一種更強大的識別流量模式的方法。比如,一個在自己的電視上觀看 Netflix 視頻的用戶可能會被碰巧運行在其本地網路中的某台電腦上的一個瀏覽器中的 JavaScript 代碼攻擊(參見下圖)。這種攻擊也依賴于歸納和測量該流媒體設備和 PC 在共同網路連接上的擁塞(congestion)。

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

為了基於記錄的流量模式識別視頻,我們使用了深度學習技術,並使用幾種領先的流媒體服務上的電影內容訓練了一個人工神經網路系統。這種神經網路視頻分類器的訓練過程類似於用戶將視頻傳輸到其流媒體設備(或軟體)的過程,並且連接到相似的流媒體服務。當被訓練識別數十個標題時,我們的 YouTube 檢測器實現了 0 負例,回調為 0.988,而 Netflix 檢測器的負例率為 0.0005,回調為 0.93.

Q&A

對於這項技術,研究者們還對一些人們關心的問題進行了解答。

Q1:哪些流媒體服務會被探測?

A:我們測試了四種熱度最高的在線視頻服務:Netflix、YouTube、Amazon Video 和 Vimeo,發現所有這些都很容易受到我們的視頻識別技術的影響。通常,流媒體服務使用 MPEG-DASH 標準運行在 HTTP(S)上,而 MPEG-DASH 的分段機制讓信息泄露變得簡單。具體原因將在 Q6 中討論。以上所有四種服務在測試中都具有危險性:YouTube 直接使用標準方式,而 Amazon Video、Netflix 和 Vimeo 使用了非常接近的變體。

Q2:流量信息如何泄露?

A:從惡意 WiFi 接入點、代理、路由器、公司網路、國家級網關和 ISP 都可以用來獲取用戶觀看視頻習慣的信息。無線網關可以使用這些信息來屏蔽受監控的內容,即使它們已被加密。

用戶訪問的所有網路內容提供商(包括廣告、分析提供者和社交網路)也可能通過利用我們的側信道攻擊來破壞用戶隱私。

Q3:VBR 與視頻內容的關係?

A:使用可變比特率壓縮(VBR)編碼可以讓視頻在給定質量的前提下存儲空間最小。這種方式高度依賴於視頻內容。例如:視頻鬣蜥與蛇之間多動作場景需要高比特率來表示。下圖展示了視頻在不同場景中比特率的波動。

示例視頻:https://www.youtube.com/watch?v=Rv9hn4IGofM

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

Q4:什麼是流量突發特徵?它與視頻內容有什麼聯繫?

A:在 MPEG-DASH 視頻流中,伺服器上的視頻會被分割為小段傳送到客戶端處。這就導致在播放中流量會呈現間歇性突發增長。

為了說明它與視頻內容本身有什麼關係,我們使用一段鬣蜥的視頻:其中存在低比特率和高比特率交織的片段。(下圖)左側顯示數據包大小延時間軸的變化,右側圖顯示流量突發的情況(第一個突發流量是緩衝)。

Q5:這種視頻識別是如何工作的?

A:這種自動視頻比對是通過機器學習演算法來完成的。通常,在線播放的視頻都會被分割為多個小塊以便下載,同時可被其他會話探知從而避免重複下載。儘管如此,我們還需要在加密協議層中引入一種非常穩定的方式來避免噪音和失真。通過使用側信道攻擊(如本研究中的 JavaScript 攻擊方式),我們可以對流媒體服務的內容或緩衝進行間接測量。

深度神經網路(多層級的人工神經網路)在多種特徵識別任務中已被證明是非常有效的。它的設計理念讓計算機可以識別各種抽象的概念:那些人類可以直觀體會,但難以表達的概念。因此,深度學習演算法是目前計算機視覺、圖像處理、語音識別、自然語言處理等領域的流行方式。在本研究中,我們構建了一個深度卷積神經網路架構來探測網路流量中視頻數據信息的特徵。深度學習方法可以形成準確的抗雜訊探測器,即使在側信道執行任務時也是有效的。

通過流量識別加密視頻內容:以色列學者提出神經網路攻擊模型

Q6:為什麼這些信息會泄露?我能防止這樣的事發生嗎?

A:流媒體信息泄露的根本原因在於感知視頻片段所需的信息量取決於片段的內容。例如:幾乎靜止的自然場景,或脫口秀的視頻中,圖像是幾乎靜態的,它可以被壓縮為體積很小的數據。流媒體服務利用了這個特點,通過可變比特率(VBR)壓縮方案來減少發送的數據量。因此,流量大小是和數據內容相關的。

我們當然可以棄用 VBR 編碼,或降低自適應碼率來改變視頻的壓縮率,但這樣做明顯會降低效率(提高了觀看成本,也會導致網路堵塞,視頻觀看卡頓)。

如果客戶端的緩衝視頻的持續時間接近於常數(或呈隨時間變化的仿射函數),則 VBR 的特性是在流量中可解的。因此,人們可以嘗試通過不斷更改緩衝區大小來規避被觀察的可能,儘管這也降低了網路效率,並增加了視頻播放緩衝延遲的幾率。

Q7:這種攻擊會被探測到嗎?

A:這種單向攻擊是完全被動式的,它無法被探測,無論是對於用戶,還是對於基於網路的監視器而言。

在我們的實驗中,旁接模式的攻擊對於觀察者而言是無法察覺的:流媒體播放並沒有受到干擾,雖然因為攻擊的存在,流量的使用略有增多。這是因為上游路由器會嘗試在多個數據流之間公平分配帶寬:在我們的例子中它們是視頻和攻擊者。由於視頻流通常只需要用到全部帶寬的不到一半,所以播放仍然順利。此外,在傳輸視頻片段時,路由器通常會給視頻更高的動態優先順序(即隊列頂部)而不會侵佔攻擊者的帶寬。攻擊者引起的額外流量會影響到用戶網路的總流量使用情況。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

OpenAI聯合DeepMind發布全新研究:根據人類反饋進行強化學習
基於神經網路的命名實體識別 NeuroNER
Uber 洗牌:創始人可能「被休假」,無人駕駛項目換帥
捷豹路虎向 Lyft 投資2500萬美元;日本要在2025年打造無人駕駛船隊 | AI Daily
MIT 新突破:實現光學深度神經網路系統

TAG:機器之心 |

您可能感興趣

流媒體視頻網站加碼原創優質內容
視頻平台VS網路電視:內容營銷提升用戶體驗是硬道理
西瓜視頻推出藝術脫口秀,著力打造優質短視頻內容
優酷、華為視頻達成深度合作:帳號打通、海量內容將全端共享
快手、火山小視頻被下架 大流量短視頻局勢漸顯 還需堅守內容價值
這位博士深掘電視用戶流量 以內容識別技術跨屏互動 與江蘇衛視促成合作
亞馬遜將加力布局印度短視頻內容 欲與本土公司爭奪網路流媒體市場
搜狐攜重磅內容陣列加入世界盃報道大戰
所謂網台較量掰手腕:「同質化」內容「差異化」播出
大搜車聯合優酷四檔綜藝深度定製品牌內容,告別洗腦式硬廣營銷
六大主流VR一體機深度橫評(四):遊戲/視頻內容誰最出色
巨量流量加持負面不斷 短視頻APP變現先把好內容關
交通出行加大補貼激活用戶,短視頻內容升級優化體驗
優酷、華為視頻達成深度合作:帳號打通、內容全端共享
採用深度分析回歸模型進行基於內容的在線請願流行度預測
深入女性重度遊戲腹地 《烈火如歌》手游用內容引爆「她經濟」
五款主流VR一體機橫向對比:體驗大幅提升 內容質量成突破口
網路文學進入過濾期,精品內容打造成未來主流
直播+短視頻,優酷 UC 聯手打造最全世界盃內容專區
押注視頻化趨勢,懂車帝試圖重新定義「汽車內容產業」