還在糾結 Python 的數據導入問題嗎?有這張速查表就夠啦
AI 研習社按:這是 Karlijn Willems 發佈於 Medium 的一篇關於 Python 中數據導入問題的博客。Karlijn Willems 是來自於 DataCamp 的數據科學研究員。她在本文中介紹一份 Python 中數據導入操作的速查表,雷鋒網(公眾號:雷鋒網) AI 科技評論對原文進行了編譯。
藉助這個 Python 速查表,你將擁有一份便捷的數據導入參考指南。該速查表全面涵蓋了平面文件(Flat files)、其它軟體所定義的原生文件類型以及關係型資料庫數據的導入方法。
在你對數據進行清理、可視化等操作之前,我們首先需要實現的事情是使用 Python 導入數據。而眾所周知,針對不同的數據文件存在著許多不同的導入方法。
但是,你最經常使用的庫可能就是 Pandas 和 Numpy:Pandas 庫是最受數據科學家喜愛的軟體庫之一,他們經常使用 Pandas 對數據進行操作和分析,然後再使用 matplotlib 進行數據可視化。而 Numpy 則是 Python 中進行科學計算的一個基礎庫,並且 Pandas 也是構建於 Numpy 之上的。
在這份數據導入速查表中,你將看到一些 Numpy 和 Pandas 的函數,以及使用 Python 語言編寫的函數,這些都將幫助你更快捷地將數據導入 Python。
這份教程將幫助你快速學習和掌握將數據導入 Python 中的基礎操作,以便於你可以對數據開展後續的清理和可視化等操作。
速查表傳送門:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Cheat+Sheets/Importing_Data_Python_Cheat_Sheet.pdf)
這份速查表將引導你學習掌握如何將數據導入實驗環境的基礎:你不僅會學到如何導入諸如文本文件這樣的平面文件,也能看到如何讀取那些來自於特定軟體的文件(比如 Excel、Stata、SAS 和 MATLAB)和關係型資料庫。最重要的是,你將獲得更多關於如何尋求幫助的指示,如何瀏覽文件系統以及如何開始探索數據信息。
總而言之,這裡有你所需要的所有知識,來幫助你開啟基於 Python 的數據科學學習大門。
如果你還想獲得更多的知識,那麼現在可以免費來學習這門《Python 數據導入課程》(https://www.datacamp.com/courses/importing-data-in-python-part-1/)或者嘗試一下我們的使用 Python 玩轉 Excel 教學!(https://www.datacamp.com/community/tutorials/python-excel-tutorial)
當然,別忘了我們為數據科學而製作的Python 速查表,並且在我們的社區能獲得更多類似的速查表!
Via:Importing Data in Python Cheat Sheet,雷鋒網編譯
春節 AI 學習狂歡,精品課程 豪華特輯
優惠折上折,福利搶不停!


※收集數據太困難?這裡為你準備了 71 個免費數據集
※50篇學術訪談實錄:一份557頁的年終答卷
TAG:AI研習社 |