當前位置:
首頁 > 新聞 > 「拒買水軍」的明星尚女士,AI 水軍了解一下?

「拒買水軍」的明星尚女士,AI 水軍了解一下?

網路世界,有人的地方就有流量,有流量的地方就少不了水軍。

屢禁不止的網路水軍似乎是個老生常談的問題,而最近歌手尚雯婕的一條微博又把這一群體推到了大眾眼前。

「拒買水軍」的明星尚女士,AI 水軍了解一下?

「我告訴團隊不要再給我買水軍了。」她坦誠經紀團隊存在通過購買「網路水軍」來提升流量的行為。

實際上,「網路水軍」這個隊伍一直緊跟時代步伐,在屢遭曝光後依舊活躍,甚至,AI「水軍」已經上崗。

「AI水軍」了解一下?

水軍已有近十年的發展歷程。

有文章將這個群體描述為:輿論收緊,社交閉合,他們蟄伏;輿論鬆綁,社交開放,他們狂歡。總之,你見,或者不見,水軍就在那裡。

只不過隨著時代的變換,真人賬號的網路水軍變得不太「吃香」,另一種靠速度和數量以及成本取勝的機器人賬號愈發成為水軍界的主流。

但簡單的機器程序刷評論,會出現大量重複性的內容、廣告,以及回復文不對題,刷表情等極易被反抄襲系統發現是虛假操作,從而封禁賬號。

隨著人工智慧技術的逐漸成熟,「AI水軍」開始出現了。

來自極驗的情報員鄭穎告訴雷鋒網宅客頻道(微信公眾號:letshome),這位水軍界的「新秀」使用循環神經網路(RNN)進行訓練,以網上大量的評論素材做訓練素材,用語言模型來預測下一個單詞的概率,從而生成新的文本。以這種技術生成的評論並非簡單地從已有素材中進行重複,所以能夠達到「以假亂真」、「爐火純青」的地步,不僅可以避免被反抄襲軟體檢測,同時也能節省人力、財力、物力上的消耗。

具體來說,以刷微信閱讀量為例,程序是如何實現的呢?

鄭穎表示,網路地下黑市盛傳的「微自動化大數據營銷系統」的工具,由成排的手機和多台電視顯示器構成。每個架子上擺放了幾十部千元機,所有手機畫面集中在電視上顯示。配合專業的「刷單」工具,可以在很短時間內完成成百上千的閱讀量。

「拒買水軍」的明星尚女士,AI 水軍了解一下?

「刷單」工作室

「網路水軍」的作業流程包含技術系統、核心資源和業務系統三個部分。其中,業務系統是對接客戶的業務需求;技術系統的核心能力是通過一台手機,模擬出成千上萬台看起來真實的手機,然後操作這些模擬的手機執行各種刷單刷量任務。

例如,當你使用一台安卓手機,點擊手機里的App, App讀取Android操作系統的底層數據,將手機標識數據包括IMEI號、品牌、Wi-Fi等傳回App的伺服器,告知有一台手機正在激活和使用App,伺服器響應並回傳應用數據。

造假技術系統的做法是,改造Android操作系統,將Android操作系統的數據介面截斷,把自己生成的數據介面接入系統,做到IMEI號,SIM卡號,電話號碼三碼合一。

在成功改造Android底層系統的基礎上,技術系統分為執行單元、資料庫模塊、應用模塊、調度模塊。

執行單元:通過一台手機模擬上幾十萬到上百萬台手機,以華為榮耀的一款手機為例,黑產可以模擬出50萬台看起來是真人在用的手機。他們在辦公室放幾百台手機,一百兆光纖,就能模擬出海量的手機協同工作。

資料庫模塊:通過機器生成或者通過資源獲取需要模擬的手機參數,包括IMEI號、Wi-Fi、IP和手機號。

應用模塊:操作腳本,指揮上百萬台模擬的手機在目標應用上進行操作不同行為,包括登陸、點贊、閱讀、打賞。

調度模塊:為了對抗大平台的反欺詐系統,模擬手機的操作必需看起來和真實用戶的使用行為接近。因此在操作的時間點——幾百萬台手機在什麼時候開機,什麼時候登陸,切換到什麼應用——需要由調度模塊執行。程序員只需要模擬真人使用行為畫時間曲線,調度模塊即可自動執行

鄭穎告訴雷鋒網,通過這樣的系統,還可以生成大量的微信號,操作微信號來刷閱讀量就輕而易舉了。當然這僅是針對微信公眾號的一波騷操作,在微博,知乎等平台刷點贊、收藏、閱讀量的原理也大同小異,涉及刷評論的操作則有些出入。

產業鏈規模

這些網路水軍到底有多猖狂?

相關數據顯示,自2017年5月以來,公安機關已破獲「網路水軍」違法犯罪案件40餘起,查獲並關停涉嫌非法炒作的網路賬號5000餘個,關閉違法違規網站上萬個,這些網站涉及的網上惡意炒作信息達數千萬條,抓獲違法犯罪嫌疑人200餘人,涉案金額高達上億元。

但喪心病狂的水軍會就此消停嗎?當然不會。

至於屢禁不絕的原因,鄭穎歸納成了三點:法制不健全;有利可圖;攻防交戰。

第一點自不必說,去年6月正式實施的《中華人民共和國網路安全法》起效需要一定的時間。

至於第二點,黑產動機各不相同,但都有一個共同點:就是逐利性。只要有利可圖,黑產就不可能消失。

批量購買水軍的金主爸爸都抱著什麼心態?


1) 薅羊毛,動用大批量賬號,刷企業營銷活動中的各類獎品;

2) 社區論壇中常見的垃圾廣告,垃圾評論。(貼吧出現爆吧的情況,除了人為攻擊外,多為大批量水軍賬號進行的垃圾灌水。)

3) 公關行為,正是由於水軍賬號(馬甲號)隱蔽性強這一特點,正面公關利用其刷數據(閱讀量、點擊量、評論量、點贊量等數據指標),完成KPI。黑公關則通過大批量賬號,進行惡意評論,引導輿論導向,攻擊對手 。

而第三點,所謂道高一尺魔高一丈,流量與風控,人性與慾望,企業與黑產的攻防大戰是一個持續性的過程。

目前,各大平台主要是從預防的角度降低水軍的規模,比如通過在註冊登錄入口部署更為安全的驗證,以及逐步落實手機號實名制。在預防層採取一些行動後,再通過IP、設備等傳統網路特徵的統計分析發現一些異常進行鑒別,然後標記進入黑名單,最後通過不斷積累的黑名單庫來鑒別出水軍。

可惜的是,目前水軍通過機器和真人操作等各種手段形成了非常成熟的機制,靠簡單的預防或者黑名單機制是很難有效反制的。

在鄭穎看來,水軍最大的特點在於有組織有預謀,這些賬號存在明顯的團伙攻擊模式,因此從團伙發現的角度能夠更精準更有效的找到這些水軍。

由於團伙攻擊時的數據是天然存在極大關聯,利用圖資料庫構建水軍操作的行為關聯,通過圖計算就能夠找到隱藏的欺詐模式。更進一步的,結合卷積神經網路能夠更深層學習的特點,可以在圖結構上運用圖卷積技術來對水軍的團伙模式自動學習自動識別,從而最大程度上反制水軍。

看你七十二變

大波水軍背後可能站著無數台機器,但對普通用戶來說,肉眼卻很難辨識出AI水軍。

有業內的研究人員曾對600個用戶進行過調查,調查顯示這些虛假的評論不僅能逃過人的法眼,而且還被用戶認為「有用」,表明虛假評論已經可以對人類造成影響。

僅僅看評論是無法識別出AI水軍的,不過你也可以嘗試從以下幾個維度去識別水軍賬號:


一是這類賬號往往無原創或原創率極低,賬號表現出極強的「小號」特徵;

二是參與熱點討論「只評論」「不轉發」;

三是短時間內出現大量口徑高度一致的評論;

四是賬號頭像、粉絲量、關注數等數據存疑。

儘管上文所述的AI水軍似乎來勢洶洶,但在鄭穎看來,目前國內水軍大多扔屬於機器行為,AI水軍還未大範圍使用,噱頭大於事實。

「AI水軍一詞是《在線點評系統中的自動眾包攻擊和防禦》趙燕斌等芝加哥大學研究人員發布的一篇論文中提出的。他們的研究說明,人工智慧可以被用來生成複雜的點評信息,這些虛假的點評不僅機器無法檢測出來,就連人類讀者也分辨不出來。」鄭穎對雷鋒網說道。

當然,據說海外AI已經投入到水軍工作中,所以國內……

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

該翻篇了!「電車難題」不應成為自動駕駛技術發展的緊箍咒

TAG:雷鋒網 |