當前位置:
首頁 > 文史 > 爬蟲實戰|爬糗事百科段子

爬蟲實戰|爬糗事百科段子

網站鏈接:https://www.qiushibaike.com/

網站截圖

主要想爬取的數據有段子內容、用戶、投票數、評論數、熱門評論等等。其實沒有用什麼特別的技巧,也沒有什麼反爬機制,所以比較簡單,用xpath來進行定位獲取相應的內容就行。

具體的步驟就不詳細說明了,po上代碼:

爬取的部分內容如下:

內容截圖

學習了一段時間,倒是能爬取很多東西了。但是學習這件事情,真的沒有終點,也意識到和小O、朱老師這樣的大神,還有很大的差距。

不過還是非常高興在DC學院學習了這門課,也很高興在群里和大家一起討論問題、學習經驗,確實少走了不少彎路。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 糗事百科 的精彩文章:

爆笑視頻:魔鬼中文聽力考試,老外聽完都懵了
10大糗圖:現在的年輕人竟然玩得這麼刺激