從爬蟲角度來說下360快視頻事件
360快視頻事件
最開始好像是東方華燈宴的視頻被發現被盜用,然後眾用戶排查發現大量B站視頻被快視頻盜用,連用戶和評論也大量照搬,並有很多B站用戶發現使用B站的用戶名、密碼可以直接在快視頻上登錄一個賬號。
詳情可以看知乎問題頁 如何看待360快視頻大量盜用B站視頻和用戶個人信息數據?
他是怎麼實現的
有網友是這樣猜測的
A.360主動參與了針對用戶群體個人信息資料庫的盜竊和/或非法買賣行為; B.360一直在通過各種渠道(比如某些有名的「安全殺毒軟體」)收集用戶的錄入信息,特別是用戶名和密碼; C.用戶名和密碼都是B站用戶託夢告訴360的; D.今天天氣真好。
以上來自[如何看待360快視頻大量盜用B站視頻和用戶 個人信息數據? - 蘇翻譯的回答 - 知乎]( https://www.zhihu.com/question/267364872/answer/322975937)
我說句難聽的話,這兄弟估計沒有聽說過爬蟲...
那假如是我,要做出這種軟體,我怎麼做呢
視頻信息以及個人用戶信息的抓取
這個對360團隊來說應該很簡單,畢竟自己做了搜索引擎,很多公司都希望他來抓。
所以抓取視頻信息,評論信息,做一個個人頁,換上一樣的id 以及頭像都是很簡單的。
因為這些信息 在B站上完全可以獲取到
為啥能用B站的賬號能直接登陸360快視頻?
很多人猜測是被脫褲了 也不是沒有這個可能,不過這種方法不太好
最簡單的方法也是爬蟲
具體如何實現的呢? 我畫了一個小圖
正常流程
360快視頻的流程
簡單的講就是 當你在360快視頻輸入賬號密碼的時候,我把你的賬號密碼拿去B站模擬登陸,登陸成功則獲取你在B站的個人頁,然後讓你跳轉到360快視頻對應的個人頁, 如果登陸不成功,則把B站返回的內容(如用戶名或者密碼錯誤)返回給用戶
所以我沒有拿到你的賬號密碼也可以做到和你的網站自動關聯.這個實現起來難么?
很簡單把...
你咋知道的?
我以前做過這種...
還有別的例子么?
支付寶裡面的公積金賬號查詢
TAG:Python爬蟲分享 |