python之股票數據分析
一、初識Pandas
Pandas 是基於 NumPy 的一個非常好用的庫,它有兩種自己獨有的基本數據結構Series (一維)和 DataFrame(二維),它們讓數據操作更簡單了。雖然Pandas有著兩種數據結構,但它依然是 Python 的一個庫,所以,Python 中有的數據類型在這裡依然適用,也同樣還可以使用類自己定義數據類型。
在金融數據分析領域,Pandas更是起到了非常重要的作用,比如用於量化交易。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具,對於億級的數據處理也如魚得水。
二、Pandas基本操作
1、Series的創建
Series的創建主要有三種方式:
1)通過一維數組創建Series
輸出如下:
2)通過字典的方式創建Series
輸出如下:
3)通過DataFrame中的某一行或某一列創建Series
參考下面DataFrame第三種創建方式中的s = df3["one"]。
2、DataFrame的創建
DataFrame的創建主要有三種方式:
1)通過二維數組創建DataFrame
輸出如下:
2)通過字典的方式創建DataFrame
以下以兩種字典來創建數據框,一個是字典列表,一個是嵌套字典。
輸出如下:
3)通過DataFrame的方式創建DataFrame
我們取出2)中的df2來創建df3
輸出如下:
三、處理股票數據
接下來,我們通過實例來學習Pandas在處理股票數據上的應用。
我們使用pandas_datareader來獲取阿里巴巴的股票數據。
1)導入以下庫:
2)設置股票名稱和時間參數
3)獲取股票數據
4)查看prices的類型
列印如下:
可以看到返回的數據類型就是DataFrame類型。
5)查看股票的摘要信息
列印 如下:
再來列印最新的三條信息
6)繪圖
我們將阿里巴巴的股票數據按照開盤價繪圖。
從圖中我們可以看到阿里巴巴的股票一路攀升,細心點發現每年的11月都有一個高點。
四、總結
Pandas是以NumPy和Matplotlib為基礎封裝的金融數據分析的庫,對於量化交易十分有用,通過可視化的效果能幫我們一定程度分析股市的走向。


TAG:充電實踐 |