當前位置:
首頁 > 最新 > 數據科學第一步,工作環境搭建

數據科學第一步,工作環境搭建

本環境是在windows系統下基於python搭建數據科學學習測試環境,採用VMware虛擬機創建一個Linux系統,那麼接下來開始我們的學(dao)習(luan)。

一、windows環境下安裝VMware

下載安裝包,點點點……

二、VMware內創建Linux虛擬機

按軟體說明,點點點……

三、虛擬機內安裝ubuntu

選擇本地的ubuntu安裝包,打開虛擬機,開始安裝。

四、ubuntu內安裝VMware Tools

點擊安裝後,在ubuntu系統內彈出CD,點開後看到安裝包,複製這個壓縮包到/tmp目錄下

打開終端,獲取管理員許可權:sudo su

輸入本機密碼(非明文),確認

進入壓縮包所在目錄,解壓文件

進入如圖目錄下,安裝vmware-install.pl

之後一路回車,安裝完畢重啟虛擬機

五、設置共享文件夾

在VMware中如上圖設置本機共享文件夾路徑

最終在/mnt/hgfs/目錄下有發現一個自行命名的共享文件夾,該文件夾可將本機和虛擬機內系統文件進行共享。

六、Linux下安裝anaconda

需要說明的是anaconda分2和3兩個大版本,兩個版本集成的python版本分別是2和3,不同大版本的python在語法上有所不同,本著學舊不如學新的態度本次測試均使用最新版本。

去官網下載anaconda linux版本即可

打開終端(Ctrl+Alt+t)進入到下載的目錄一般在home 下的Downloads (或者進入到下載的文件夾右鍵打開open Terminal也可以)

執行命令bashAnaconda3-5.10-Linux-x86_64.sh(這裡是寫你下載的版本型號),回車,一路yes即可

安裝完成之後,打開新的Terminal終端,在終端中查看版本信息確認是否安裝

輸入conda-V

註:本人測試時是在windows系統內下載好了anaconda的Linux安裝包,放入了共享文件下內,因此只需要進入共享文件夾安裝即可。

七、anaconda下安裝tensorflow

下附官網安裝方式參考:

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/docs_src/install/install_linux.md#InstallingAnaconda

本次實驗本機安裝的是anaconda3,IDE python3.6,安裝的是cpu版本tensorflow,GPU版本不實驗(TensorFlowGPU版本,需要NVIDIA顯卡的支持,但是光有顯卡還不夠,還需要NVIDIA的CUDA平台,不安裝的話會報錯,且GPU只是加快了計算速度,對於實驗環境來說不是特別重要)。

為Anaconda創建一個python3.5(或者3.6都行,隨便)的環境,環境名稱為tensorflow ,輸入下面命令:

conda create -n tensorflow

啟動tensorflow的環境

source activate tensorflow

當不使用tensorflow時,關閉tensorflow環境,命令為:

source deactivate tensorflow

安裝cpu版本的TensorFlow:

pip install --upgrade --ignore-installedtensorflow tfBinaryURL

本機執行命令為pip install --ignore-installed--upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-1.3.0-cp36-cp36m-linux_x86_64.whl

我覺的,也可以不寫後面的地址(未測試)

測試是否安裝完成

import tensorflow as tf

hello = tf.constant("Hello, TensorFlow!")

sess = tf.Session()

print(sess.run(hello))

使用jupyter notebook驗證,在終端內輸入jupyter notebook,回車,系統自動調用瀏覽器打開

創建一個新的python腳本

在一行命令框內輸入,運行

運行結果顯示b』hello,tensorflow!』說明安裝成功。

八、windows版本anaconda下安裝tensorflow

windows環境下安裝anaconda後可以直接使用Anaconda Navigator這一組建搭建,該組建可以對anaconda安裝的所有組建、包進行管理。

建議單獨為tensorflow創建一個環境,單擊左側邊欄的Environments選項。

新環境創建完成後會有一些默認的依賴包,不必理會。在右側主窗體上方,切換成notinstalled, 然後搜索tensorflow。可以看到下方會有tensorflow相關包的列表。點擊勾選想要安裝的tensorflow版本,然後點擊apply。Anaconda就會從網路上下載對應的包了,這可能需要一段時間。

至此,tensorflow的開發環境基本上配置完畢了,在python命令行中執行:

import tensorflow as tf,也可以在spyder中執行命令。

總結:對於數據科學來說,python是一個神器,不僅因為它是一個開源工具,更是因為它有良好且成熟的開源社區和開發環境,比如本文中涉及到的anaconda軟體就是一個非常棒的IDE,同樣的,深度學習框架選擇tensorflow也是因為它良好且強大的開源社區(google的大腿抱一抱)。以上,只是針對個人進行數據科學入門學習的小總結,如有錯誤歡迎指(da)出(lian)!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 觀天執道 的精彩文章:

TAG:觀天執道 |