Python練習-簡單爬蟲
一入「程」門深四海......
有學習就得有練習,我來練一個文本爬蟲,代碼直接寫到下面,抓取的是網頁圖片,簡單好學,適合新手練習。
話不多說直接上乾貨!
1. 目標網址:https://www.jikexueyuan.com
2. 準備工具
Python2.7
PyCharm5.3
這兩個軟體Python版本我目前用的是版本2,還沒有使用3版本,因為知道這是有個別改動,相信把版本2學好了,升級到3沒有多大問題,PyCharm下載的時候也要對應Python的版本下載,具體下載新手請找度娘。
3.上面兩個下載好了還要下載一個Requests來獲取網頁,這是需要導入的一個第三方
4.開始編程
在編程開始之前展示一下抓取結果,這些就是在極客學院上面抓取的教學圖片。
5. 分解步驟:
1)打開極客學院網址,選擇課程庫
2)右擊審核元素,這可以直接看到對應的圖片地址;點擊Elements的放大鏡,將滑鼠移動到圖片上面,下面會出現圖片對應的地址(深顏色),可以看到一個詞:Class=」lessonplay」
3) 將PyCharm打開,新建一個文件夾,取名pachong,裡面建一個picdownloader.py的文件;建一個source.txt文件;在建一個pic文件夾。
4)打開網頁的源代碼,將查找到的所有(class=」lessonplay」)複製粘貼到source.txt文件裡面。
5)開始編程
將會看到下面測試出來圖片匹配的數字是24個,也就是說我們爬取的網頁當前頁有24張圖片。
最後歡迎大佬指導改正意見~~
- THE END -


※想要學好Python開發技術 首先學會安裝Python
※6款Python 特殊文本格式處理庫,必知必會了解一下
TAG:Python |