2017碼字小結:感謝有你
這個微信公眾號「數據分析」註冊於2013年3月2日,自從註冊後就一直晾著,從2017年1月開始接觸Python後,開始記錄學習過程中的點點滴滴,雖然文筆不好,寫的文章不多,但是自此養成了記錄筆記的習慣,不管是遇到的問題,或者一瞬間的想法,總會想到把它記錄下來,整理後形成系統化的筆記,當別人問起或自己再遇到類似問題的時候,可以馬上甩一段過去,效率提升很多,真可謂是做事靠系統,做人看感覺。數一數,今年寫了37篇,在2018年即將到來之際,把今年碼的文章做了一個小結,既為自己的17年總結存檔,也讓大夥可以更快的找到自己需要的文章。
Python入門
京東每月的圖書勳章券總是不會落下,買書如山倒,讀書如抽絲,但這一年Python的書還是看了不少的,《廖雪峰的Python教程》、《利用Python進行數據分析》、《流暢的Python》、《Python爬蟲開發與項目實戰》、《Python核心編程》,15年的時候讀了100本書,零零散散記錄了一些讀書筆記,但沒有形成體系化的總結,內化成自己的系統。重新養成記錄筆記的習慣是從閱讀《廖雪峰的Python教程》開始的,這個在線的教程對於剛接觸Python的人是很友好的,抓住了重點,而且每一節後有一些小練習,可以在線測試,驗證學習效果,值得推薦。後面覺得只是看一看記錄筆記的話,又回到了之前的狀態,所以後面放棄了這個路子。以下幾篇是很樸實的筆記。
爬蟲
紙上得來終覺淺,絕知此事要躬行。通過感興趣的項目行動式學習,對於大部分人來說是很有效果的,因為興趣所在,你會沉浸于思考,興緻高昂地碼代碼,讓bug來得更猛烈些。雖然爬取鏈家廣州的房價對最後的購房決策影響不是很大,但是看那活生生的數據有成就感,也在網上看到有提供鏈家房價的介面服務,數據就是財富。
碼農利器
要說第一利器,非科學上網莫屬,Google是搜索第一手技術的最好方法,沒有之一,Stack Overflow能解決你遇到的絕大部分bug,而Github的Stars,也是個人能力的最好證明。
而沉浸式寫作利器,非Markdown莫屬,自從接觸了Markdown,記筆記都用上了Markdown,而有道雲筆記是支持Markdown寫作的,配合Markdown Here,微信公眾號文章的一鍵排版,鬆鬆啦。
數據分析/數據挖掘/機器學習
機器學習和深度學習是最近的大熱門,8月份看到Data Tech 2017浙江大數據建模與創新應用大賽的模型挑戰賽,自己也湊了個熱鬧,雖然最後未進入決賽,但是把《利用Python進行數據分析》這本書來來回回翻了好幾遍,之前看這本書的時候都是翻一翻就過,沒有通過實戰演練,通過這次比賽,把讀取數據、數據預處理、特徵工程、模型訓練與調優過程中用到的方法都過了一遍,尤其是pandas庫和sklearn庫,也體會到Google和Stack Overflow英文關鍵詞搜索的強大。後續遇到數據讀取、處理、分析的時候,也會想一想如果用pandas應該怎麼怎麼做。
Hadoop/CDH
全棧數據工程師,分散式存儲和計算框架Hadoop是必不可少的,恰好企業內部有Hadoop/CDH的在線學習課程,通過理論加實踐的方式學習,效果甚好,同事評價也比較高。
微信公眾號「數據分析」,分享數據科學家的自我修養,既然遇見,不如一起成長。
Telegram Group:
https://t.me/sspadluo
轉載請註明:轉載自微信公眾號「數據分析」


TAG:數據分析 |