一幅圖講清楚Python在大數據與人工智慧時代的地位
大數據與人工智慧時代,
掌握Python基礎後,我們可以選擇數據分析方向、人工智慧方向、全棧開發方向...
如果想要追趕 Python 的熱潮,應該如何學習呢?除了自學之外,多數人都會選擇在線課程作為輔助。選擇課程的衡量標準是什麼呢?我認為有以下幾條坑不能踩:
||
是否針對零基礎入門?
零基礎入門分為三種情況:一種是之前接觸過計算機編程,但並沒有熟練掌握任何一門語言,另一種是有其它編程語言基礎,但沒有接觸過Python,最後一種是沒有接觸過任何編程語言。
||
是否可以掌握一項核心的技能?
Python基礎;網路爬蟲;數據分析等。
||
是否針對零基礎的同學講解的生動易懂?
不少課程會標註課程所需的知識儲備,需要先掌握哪些知識才能看懂這門課,只有少數課才真正是零基礎可以學習的,這個是需要注意的。我覺得更多學習在線課程的還是零基礎的同學,畢竟有基礎的話自己擼文檔就好了。
||
是否配備了高質量的答疑服務?
實際編程會遇到問題被卡住真是太常見的一個事情了,很多程序員沒了 stackoverflow 也是無法正常工作的。但初學者很可能是連問題都描述不清楚的,所以有個老師幫初學者即時解決問題的話,能節省很多時間。
專註於人工智慧前沿科技的在線教育平台—深藍學院,聯合百度資深演算法工程師推出『
Python基礎入門與網路爬蟲實踐
』、『
Python數據分析
』兩門在線直播課程。兩門課程共56學時,課程從Python基礎入門開始,實戰講述新聞網站、知乎、京東商城、微信公眾號的網路爬蟲技術,將爬取的數據清洗整理,直接用於數據分析課程實踐。課程在線直播授課,一年內均可在微信答疑群提問答疑,講師真正做到有問必答。
Python 課程內容
1.
Python基礎入門
1.1 Python基礎
1.1.1
Python簡介與發展歷史
1.1.2
Python安裝與開發環境
1.1.3
基本類型、運算1.
2 Python語句與語法及文件操作1.
2.1
語句與語法包括
1.
2.2
迭代器1.
2.3
文件操作1.
3 函數與模塊1.
3.1
函數基礎與作用域、參數與返回值、遞歸
1.
3.2
匿名函數:lambda與函數式編程工具:filter和reduce
1.
3.3
模塊基礎
1.
4 面向對象與異常處理1.
4.1
面向對象(類和對象)1.
4.2
異常處理
1.
5 多線程、正則表達式的使用1.
5.1
線程模塊、線程同步
1.
5.2
多進程(通信與進程池)
1.
5.3
正則表達式
1.
6 網路編程1.
6.1
TCP/IP、Socket、C/S架構
1.
6.2
HTTP,FTP以及郵件協議
1.
6.3
RPC
2.
Python網路爬蟲實踐
2.1 網路爬蟲入門
2.1.1
網路爬蟲技術價值
2.1.2
HTTP協議2.1.3
網頁的常見構成2.1.4
分散式數據存儲MongoDB2.1.5
實踐:單頁面的抓取2.
2 爬蟲基礎:一個簡單的爬蟲構成2.
2.1
靜態網站的抓取
2.
2.2
多線程抓取2.
2.3
多進程抓取2.
2.4
實踐:新聞網站的爬取2.
3 基於框架的爬蟲:Selenium2.
3.1
自動化爬蟲框架PhantomJS+Selenium
2.
3.2
表單,網站登錄
2.
3.3
客戶端渲染頁面的抓取2.
3.4
實踐:知乎網站的抓取2.
3.5
實踐:微信公眾號內容的抓取2.
4 基於框架的爬蟲:Scrapy2.4
.1
框架簡介與分析2.4
.2
框架的核心內容及使用方法2.4
.3
實踐:京東網站的抓取2.
5 基於框架的爬蟲:分散式爬蟲2.
5.1
分散式爬蟲的框架
2.
5.2
任務調度的設計2.
5.3
分散式集群部署的爬蟲與百度爬蟲簡介2.
5.4
分散式存儲框架ElasticSearch搜索引擎2.
5.5
實踐:一個簡單的搜索引擎2.
6 爬蟲常見問題2.
6.1
反爬蟲常見問題
2.
6.2
驗證碼:驗證碼的識別:實踐:識別驗證碼
2.
6.3
反IP:多IP技術2.
6.4
移動端(手機端)內容抓取i.Fiddle抓包分析
ii.使用API來進行抓取
iii.示例:今日頭條、快手微視頻的抓取
3.
Python網路爬蟲實踐
3.1 Python數據分析簡介
3.1
.1 Python數據分析環境配置(Anaconda)3.1
.2 Python數據分析的各個模塊的作用和關係3.1
.3 Python數據分析安裝配置常見庫:NumPy, Pandas, SciPy, Matplotlib3.1
.4 數據分析應用場景與簡要示例3.2 NumPy庫的介紹
3.2
.1 NumPy的性能優勢
3.2
.2 數組對象處理3.2
.3 矩陣處理3.2
.4 基本操作與實踐案例3.3 Pandas庫的介紹
3.
3.1 Pandas基本數據結構與功能(Series)3.
3.2 DataFrame缺失數據處理3.
3.3 統計功能3.
3.4 數據合併、分組及比較3.
3.5 基本操作與實踐案例3.4 Python文本數據與圖像數據分析的常見技術
3.4
.1 文本分析:清洗與常見演算法a) 正則表達式
b) 分詞與關鍵字提取
3.4
.2 圖像分析:預處理方法(PIL)a) 圖像數據讀取
b) 圖像分析
3.4
.3 基本圖像處理的基本流程3.4
.4 實踐:基於微博數據的人物信息的提取、清洗3.5 數據可視化
3.5
.1 數據可視化簡介3.5
.2 常用可視化方式與圖表繪製3.5
.3 Matplolib3.5
.4 Seaborn3.5
.5 實踐:基於微博數據的人物信息以及關係的數據可視化3.6 Python與機器學習
3.6
.1 什麼是機器學習3.6
.2 scikit-learn介紹3.6
.3 scikit-learn內常用演算法介紹3.6
.4 機器學習基本流程3.6
.5 實踐:微博人物相似聚類演算法3.7 Python與深度學習
3.7
.1 深度學習簡介3.7
.2 Tensorflow入門3.7
.3 Kaggle:簡單二分類:貓狗識別3.7
.4 實踐圖像分類:微博明星人臉識別3.8 Python與社交網路
3.8
.1 圖(graph)基礎3.8
.2 社交網路演算法(包括PageRank演算法、社區發現演算法等)3.8
.3 igraph介紹與network
3.8
.4 實踐微博社區發現演算法:明星關係與可視化
講師介紹
賀老師
,百度資深演算法工程師,主要負責基於Python的策略架構,以及基於大數據的人工智慧應用落地。曾工作於某知名金融信息公司,負責金融實時數據採集與分析,期間設計並實現基於Spark的非結構化數據處理的領域專用語言(Domain Specific Language; DSL)
,其核心內容
在中國軟體開發者大會進行演講。
南開大學計控學院碩士,碩士期間主要研究方向是基於FPGA的並行計算,獲得優秀碩士論文。
開課時間及形式
1.
前100名
報名者
,最高可領取300元
優惠券,最低100元;2.
每周周六、周日晚上在線
直播
授課;3.
課程
一年
內
可實時查看視頻回放;
4.
課程
PPT和源程序
,會提前公開給學員;5.
課前、課中和課後,
微信群
均可答疑。請添加
助教
微信
諮詢
