當前位置:
首頁 > 最新 > Python練習-簡單爬蟲

Python練習-簡單爬蟲

一入「程」門深四海......

有學習就得有練習,我來練一個文本爬蟲,代碼直接寫到下面,抓取的是網頁圖片,簡單好學,適合新手練習。

話不多說直接上乾貨!

1. 目標網址:https://www.jikexueyuan.com

2. 準備工具

Python2.7

PyCharm5.3

這兩個軟體Python版本我目前用的是版本2,還沒有使用3版本,因為知道這是有個別改動,相信把版本2學好了,升級到3沒有多大問題,PyCharm下載的時候也要對應Python的版本下載,具體下載新手請找度娘。

3.上面兩個下載好了還要下載一個Requests來獲取網頁,這是需要導入的一個第三方

4.開始編程

在編程開始之前展示一下抓取結果,這些就是在極客學院上面抓取的教學圖片。

5. 分解步驟:

1)打開極客學院網址,選擇課程庫

2)右擊審核元素,這可以直接看到對應的圖片地址;點擊Elements的放大鏡,將滑鼠移動到圖片上面,下面會出現圖片對應的地址(深顏色),可以看到一個詞:Class=」lessonplay」

3) 將PyCharm打開,新建一個文件夾,取名pachong,裡面建一個picdownloader.py的文件;建一個source.txt文件;在建一個pic文件夾。

4)打開網頁的源代碼,將查找到的所有(class=」lessonplay」)複製粘貼到source.txt文件裡面。

5)開始編程

將會看到下面測試出來圖片匹配的數字是24個,也就是說我們爬取的網頁當前頁有24張圖片。

最後歡迎大佬指導改正意見~~

- THE END -


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Python 的精彩文章:

想要學好Python開發技術 首先學會安裝Python
6款Python 特殊文本格式處理庫,必知必會了解一下

TAG:Python |