數據科學第一步,工作環境搭建
本環境是在windows系統下基於python搭建數據科學學習測試環境,採用VMware虛擬機創建一個Linux系統,那麼接下來開始我們的學(dao)習(luan)。
一、windows環境下安裝VMware
下載安裝包,點點點……
二、VMware內創建Linux虛擬機
按軟體說明,點點點……
三、虛擬機內安裝ubuntu
選擇本地的ubuntu安裝包,打開虛擬機,開始安裝。
四、ubuntu內安裝VMware Tools
點擊安裝後,在ubuntu系統內彈出CD,點開後看到安裝包,複製這個壓縮包到/tmp目錄下
打開終端,獲取管理員許可權:sudo su
輸入本機密碼(非明文),確認
進入壓縮包所在目錄,解壓文件
進入如圖目錄下,安裝vmware-install.pl
之後一路回車,安裝完畢重啟虛擬機
五、設置共享文件夾
在VMware中如上圖設置本機共享文件夾路徑
最終在/mnt/hgfs/目錄下有發現一個自行命名的共享文件夾,該文件夾可將本機和虛擬機內系統文件進行共享。
六、Linux下安裝anaconda
需要說明的是anaconda分2和3兩個大版本,兩個版本集成的python版本分別是2和3,不同大版本的python在語法上有所不同,本著學舊不如學新的態度本次測試均使用最新版本。
去官網下載anaconda linux版本即可
打開終端(Ctrl+Alt+t)進入到下載的目錄一般在home 下的Downloads (或者進入到下載的文件夾右鍵打開open Terminal也可以)
執行命令bashAnaconda3-5.10-Linux-x86_64.sh(這裡是寫你下載的版本型號),回車,一路yes即可
安裝完成之後,打開新的Terminal終端,在終端中查看版本信息確認是否安裝
輸入conda-V
註:本人測試時是在windows系統內下載好了anaconda的Linux安裝包,放入了共享文件下內,因此只需要進入共享文件夾安裝即可。
七、anaconda下安裝tensorflow
下附官網安裝方式參考:
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/docs_src/install/install_linux.md#InstallingAnaconda
本次實驗本機安裝的是anaconda3,IDE python3.6,安裝的是cpu版本tensorflow,GPU版本不實驗(TensorFlowGPU版本,需要NVIDIA顯卡的支持,但是光有顯卡還不夠,還需要NVIDIA的CUDA平台,不安裝的話會報錯,且GPU只是加快了計算速度,對於實驗環境來說不是特別重要)。
為Anaconda創建一個python3.5(或者3.6都行,隨便)的環境,環境名稱為tensorflow ,輸入下面命令:
conda create -n tensorflow
啟動tensorflow的環境
source activate tensorflow
當不使用tensorflow時,關閉tensorflow環境,命令為:
source deactivate tensorflow
安裝cpu版本的TensorFlow:
pip install --upgrade --ignore-installedtensorflow tfBinaryURL
本機執行命令為pip install --ignore-installed--upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-1.3.0-cp36-cp36m-linux_x86_64.whl
我覺的,也可以不寫後面的地址(未測試)
測試是否安裝完成
import tensorflow as tf
hello = tf.constant("Hello, TensorFlow!")
sess = tf.Session()
print(sess.run(hello))
使用jupyter notebook驗證,在終端內輸入jupyter notebook,回車,系統自動調用瀏覽器打開
創建一個新的python腳本
在一行命令框內輸入,運行
運行結果顯示b』hello,tensorflow!』說明安裝成功。
八、windows版本anaconda下安裝tensorflow
windows環境下安裝anaconda後可以直接使用Anaconda Navigator這一組建搭建,該組建可以對anaconda安裝的所有組建、包進行管理。
建議單獨為tensorflow創建一個環境,單擊左側邊欄的Environments選項。
新環境創建完成後會有一些默認的依賴包,不必理會。在右側主窗體上方,切換成notinstalled, 然後搜索tensorflow。可以看到下方會有tensorflow相關包的列表。點擊勾選想要安裝的tensorflow版本,然後點擊apply。Anaconda就會從網路上下載對應的包了,這可能需要一段時間。
至此,tensorflow的開發環境基本上配置完畢了,在python命令行中執行:
import tensorflow as tf,也可以在spyder中執行命令。
總結:對於數據科學來說,python是一個神器,不僅因為它是一個開源工具,更是因為它有良好且成熟的開源社區和開發環境,比如本文中涉及到的anaconda軟體就是一個非常棒的IDE,同樣的,深度學習框架選擇tensorflow也是因為它良好且強大的開源社區(google的大腿抱一抱)。以上,只是針對個人進行數據科學入門學習的小總結,如有錯誤歡迎指(da)出(lian)!


TAG:觀天執道 |