數據分析從哪裡開始入門學習,可以推薦的書有哪些?
作者 Gam
本文為CDA志願者投稿作品,轉載需授權
數據行業在迅速的發展,幾乎每天都會出現新的技術和方法。因此,想要跟上這個行業的步伐是有挑戰性的。之前CDA數據分析師曾列出了15位在科技和數據科學領域最具影響力人物,他們不僅僅是數據科學專業人士和關注該領域人群的靈感來源,同時關注他們也確保你能夠了解該領域的發展動向。
除參考國外的數據分析工作外,CDA數據分析學院結合多年數據分析培訓和教育經驗,總結了個人在獲得第一份工作以後,如何能在崗位上不斷提升,真正實現自己在數據分析行業的職業規劃提升。基於此,CDA數據分析研究院提供了科學的數據分析行業進階規劃如下:
統計概率基礎:數據分析行業分析,數據挖掘經典流程,數據的描述性分析,數據的推斷性分析,方差分析,回歸分析,多元統計等系列理論課程,唯有掌握原理,方能駕馭工具。
數據分析工具學習:根據等級的要求,一般軟體在學術界和企業界的應用廣泛程度如下:
學術界 :STATA >R > Matlab> SPSS >SAS ;
商業界:SPSS>R>SAS > PYTHON 。
上手難度:SAS>R>PYTHON>SPSS>EXCEL工具的選擇不在於多,而在於跟具體問題相結合,在學習的過程中可以選擇1-2門的工具進行熟練使用。參考各大數據分析工具的區別。
數據分析建模:利用工具進行數據分析模型、數據挖掘演算法建模運用,常用的數據分析方法有(回歸分析法、主成分分析法、典型相關分析、因子分析法、判別分析法、聚類分析法、結構方程、Logistic模型等),常用的數據挖掘演算法有(時間序列、Panel Data、關聯法則、神經網路、決策樹、遺傳演算法)以及可視化技術。
以上三部分皆為數據分析硬性技術,要想熟能生巧需要經常在學習和工作中運用,不斷改善,不斷優化模型,將技術與具體業務結合起來,經過長時間的積累方能成為高級數據分析師。
提升推薦書單
《DEEP LEARNING 深度學習》
作者:[美]Ian Goodfellow(伊恩·古德費洛)、[加]Yoshua Bengio(約書亞·本吉奧)、[加]Aaron Courville(亞倫·庫維爾)
出版社:人民郵電出版社
AI聖經!深度學習領域奠基性的經典暢銷書!長期位居美國亞馬遜AI和機器學習類圖書榜首!所有數據科學家和機器學習從業者的必讀圖書!特斯拉CEO埃隆·馬斯克等國內外眾多專家推薦! 深度學習是機器學習的一個分支,它能夠使計算機通過層次概念來學習經驗和理解世界。
《Python Deep Learning》
「Take your machine learning skills to the next level by mastering Deep Learning concepts and algorithms using Python. About This Book ?Explore and create intelligent systems using cutting-edge deep learning techniques ?Implement deep learning algorithms and work with revolutionary libraries in Python ?
《利用Python進行數據分析》
作者:(美)麥金尼著,唐學韜等譯
出版社:機械工業出版社
本書講的是利用Python進行數據控制、處理、整理、分析等方面的具體細節和基本要點。同時,它也是利用Python進行科學計算的實用指南(專門針對數據密集型應用)。本書重點介紹了用於高效解決各種數據分析問題的Python語言和庫。《利用Python進行數據分析》沒有闡述如何利用Python實現具體的分析方法。
《機器學習》
作者:周志華
出版社:清華大學出版社
這是一本面向中文讀者的機器學習教科書, 為了使儘可能多的讀者通過本書對機器學習有所了解, 作者試圖儘可能少地使用數學知識。
然而, 少量的概率、統計、代數、優化、邏輯知識似乎不可避免. 因此, 本書更適合大學三年級以上的理工科本科生和研究生,以及具有類似背景的對機器學習感興趣的人士. 為方便讀者, 本書附錄給出了一些相關數學基礎知識簡介。
數據挖掘導論(完整版)
作者:(美)陳封能 等
出版社:人民郵電出版社
本書全面介紹了數據挖掘,涵蓋了五個主題:數據、分類、關聯分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章。前一章涵蓋基本概念、代表性演算法和評估技術,而後一章討論高級概念和演算法。這樣讀者在透徹地理解數據挖掘的基礎的同時,還能夠了解更多重要的高級主題。
統計學(第六版)
作者:賈俊平
出版社:中國人民大學出版社
統計學》第六版是在第五版的基礎上修改而成的。在廣泛吸取讀者意見的基礎上,對第五版中的部分內容進行了修訂。第六版在結構上與第五版基本相同,但對部分章節上進行了重新寫和修訂。其中,第13章進行了重新編寫,更新了全部數據,並將季節型序列的預測一節合併到複合型序列的分解預測中。第5章對部分內容作了簡化。第9章增加了SPSS的應用。


※數據分析技術 給商業模式帶來顛覆的五種方式
※您有一份讓吳恩達稱讚的深度學習的課程筆記,請注意查收!
TAG:CDA數據分析師 |