被人用搜索引擎蹭熱點的「我院」
一、事件始末
小白:大東東,今天我在搜索引擎上搜「中科院」,搜到了好多奇奇怪怪的網頁啊,你看下面那張截圖。
網友通過搜索引擎結果進入的「中科院」網站
小白:大東東你用搜索引擎搜索「中科院」!
大東:嗯?我這裡還是挺正常的啊。
小白:我還沒說完呢,你在前面加上「diss」關鍵詞再搜。你看看這搜到的都是些啥啊!
大東:這不搜不知道,一搜嚇一跳呀。 難道「中科院」的關鍵詞都被這些「野雞」網站佔領了?
「diss
中科院」的搜索結果第一頁
小白:這是咋回事啊,大東東。
大東:從技術上來說,這很可能與搜索引擎的 SEO 有關。
二、搜索引擎那些事兒
小白:SEO?
大東:Search Engine Optimization,搜索引擎優化。它是一種利用搜索引擎的搜索規則來提高目前網站在有關搜索引擎內的自然排名的方式。
小白:噢,搜索結果的排序就跟這個 SEO 有關?
大東:一定程度上是的。搜索引擎根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。
小白:我懂了。
大東:不過,小白,這個 diss 是啥意思?
小白:哈哈,沒想到還有大東東沒聽過的流行語呀~這個diss呢,是英文單詞 Disrespect (不尊重)或是 Disparage(輕視) 的簡寫。以前使用在 Hip Hop 中,rapper 之間用唱 diss 曲的方式來互相貶低和批判。去年國內某選秀節目的走紅,將 diss 這個詞帶向了網路世界,也被用在生活中,以此表達不滿。
大東:原來是這個意思。
小白:大東東,那搜索引擎在今天這件事里出了啥問題呀?
大東:你看,一旦我們在搜索「中科院」關鍵詞的前面加上別的關鍵詞,搜索結果排名靠前的就是一些「污染眼球」的東西,這與兩個關鍵詞的組合搜索策略有關。我們再搜索其他與「diss」組合的關鍵詞,比如「diss 清華」、「diss 北大」,搜索結果都很正常,說明很可能有人利用了「中科院」關鍵詞和搜索引擎策略,惡意蹭咱中科院的搜索熱度。
小白:有道理!難怪搜索「16顆氣象衛星中科院」也會出現這種狀況!這是赤果果的蹭咱流量啊!
大東:極可能是惡意蹭流量的人掌握了搜索引擎搜索排名的策略,從而惡意利用。
小白:這種重要的策略也能輕易被人掌握!
大東:那可不,這背後很有可能涉及黑色產業,黑色產業鏈網站上已有不少分析提高搜索排名的文章。
三、真假「美猴王」
小白:誒,大東東你看,這些搜索出來的「野雞」網站里,有些點進去是賭博網站,有些是黃色網站,這我都理解,只要他們把網站標題換成帶有「中科院」的,就能把流量導入自己的網站。可是,還有些網站看起來就跟中科院官網一模一樣,只是某些細節被惡搞了,簡直真假美猴王啊。這是怎麼回事?
中科院官網的鏡像網站頁面
大東:這是利用了網站鏡像技術。網站鏡像通過複製整個網站或部分網頁內容並分配以不同域名和伺服器,以此欺騙搜索引擎對同一站點或同一頁面進行多次索引的行為。
小白:竟然還有這種技術!應該不是因為惡意利用產生的吧!
大東:鏡像網站存在有兩種情況,一種是網站主動建立,將同一個網頁內容放在不同伺服器上,隨時保持各個伺服器上內容一致,用以對用戶訪問的分流。
小白:另一種就是這種惡意建立的吧!
大東:沒錯,這種技術也為他人的惡意複製提供了可乘之機。這有可能會導致正確網站的流量明顯減少,在搜索引擎的 SEO 中排名降低。當網站被鏡像後,不及時處理,時間一長很容易被降權,如果再想恢復就比較難了。
四、太上老君煉丹爐
小白:啊?那那那咱有啥應對的辦法么?
大東:防止鏡像的辦法當然有了,最有效的辦法就是屏蔽 IP,找准鏡像站的伺服器 IP 地址,在 WEB 伺服器的配置中禁止訪問,先屏蔽掉鏡像網站所屬 IP 的訪問行為,阻止鏡像站通過技術手段不斷的抓取自己網站的信息。不管是 IIS、Apache 或者 Ngnix 均有相應的設置方法。
小白:噢,那其他辦法呢?
大東:也可以向搜索引擎的舉報平台進行投訴,你看,現在我們投訴以後,就搜不到了。記住了,如果是在百度搜索到的,可以向站長平台(http://zhanzhang.baidu.com/feedback)反饋,如果鏡像站點中涉及惡劣賭博、色情內容,還可以向舉報平台(http://jubao.baidu.com/jubao/)投訴。
小白:那對於各網站來說,有預防他人惡意鏡像的辦法么?
大東:有。站主可以改變網站程序位置,由根目錄換到一級目錄。因為惡意鏡像只能解析 IP,而無法與目錄進行綁定。此外,還可以把網站內所有路徑都設置為絕對路徑,這樣做不僅可以最大限度的避免網站被惡意鏡像,也有利於提升網站權重。
小白:噢~我造了~所以今天搜索引擎這個鍋,咱中科院,不~背~
五、網路世界的陷阱
小白:天惹嚕,網路世界真是陷阱重重啊!
大東:其實這在黑產很普遍,釣魚網站、暗鏈、網頁篡改也是常見伎倆。
小白:釣魚網站我知道!釣魚網站指的是偽裝成其他網站的騙子網站,因為長得與原網站非常相似,很容易就騙取到用戶的重要信息,通常是一些銀行及電子商務竊取用戶提交的銀行帳號、密碼等私密信息的網站。不過,這種障眼法可以輕輕鬆鬆被電腦殺毒軟體查殺~
釣魚網站
大東:小白有長進嘛,那你了解暗鏈和網頁篡改嗎?
小白:這個這個...還是大東東給我講講吧~
大東:其實「暗鏈」就是看不見的網站鏈接,「暗鏈」在網站中的鏈接做得非常隱蔽,短時間內不易被搜索引擎察覺。它和友情鏈接有相似之處,可以有效地提高網頁的網頁等級值,提高網站的排名。
小白:那要是暗鏈被壞人利用了呢?
大東:那就是「暗鏈攻擊」了,黑客通過隱形篡改技術在被攻擊網站的網頁植入暗鏈,這些暗鏈往往被非法鏈接到色情、詐騙、甚至反動信息。
小白:哦!難怪有時候我想要在網頁里查點資料,卻總有些奇怪的網頁或者彈窗冒出來,原來就是暗鏈啊!
大東:沒錯。而網頁篡改是黑客針對網站程序漏洞,向其植入木馬,篡改網頁,添加黑鏈或者嵌入非本站信息,甚至是創建大量目錄網頁。一旦網站信息被篡改,搜索引擎和安全平台會檢測到該網站被掛馬,會在搜索結果提示安全風險,搜索引擎和瀏覽器有可能對訪問的用戶進行攔截。
小白:真是豈有此理!真想把這些壞蛋都揪出來!
來源:中國科學院計算技術研究所


※研究揭示靈長類大腦精細視覺編碼新機制
※科研人員備出黑磷基光致形變複合材料
TAG:中科院之聲 |