當前位置:
首頁 > 最新 > 使用Google Colaboratory訓練神經網路

使用Google Colaboratory訓練神經網路

作者:Sagar Howal

編譯:weakish

編者按:數據科學開發者Sagar Howal通過一個淺顯易懂的示例,介紹了如何使用Google Colaboratory——Google提供的用於數據科學和機器學習的協作開發工具。Colaboratory十分好用,而且是免費的。

Google最近發布了Google Colaboratory(g.co/colab)。Google Colaboratory原為Google數據科學編程的內部協作工具,現在Google把它作為公開服務發布出來。Google Colaboratory基於Jupyter開源項目,並集成了Google Drive。Colaboratory使用戶能像使用Google文檔或電子表格一樣方便地使用Jupyter Notebook。

Colaboratory

使用Colaboratory很簡單。如果你有Google賬號的話,直接訪問Colaboratory網站即可開始使用。Colaboratory讓你使用Google的虛擬機運行機器學習任務,這樣你可以直接上手構建模型,無需擔憂算力問題。而且,它是免費的。

初次打開Colaboratory,你會看到一個歡迎文件「Hello, Colaboratory」,裡面有一些基本的例子。你可以嘗試一下。

在Colaboratory中,你可以像在Jupyter Notebook中一樣編寫代碼。按可以運行代碼塊,結果會顯示在代碼塊下方。

除了代碼之外,你也可以運行shell命令,加上!作為前綴就可以,例如:

下面我將通過一個例子演示如何使用Colaboratory訓練神經網路。我們將在UCI機器學習倉庫提供的威斯康星州乳腺癌資料庫上訓練一個神經網路。

這裡是與本文配套的Colaboratory notebook。

深度學習

本文假設讀者對神經網路和深度學習有一定了解。如果你需要溫習這方面的知識,可以參考Carlos Greshenson的論文(這是一篇非常容易閱讀的論文)。你也可以參考其他網上資源。

不過,即使你現在還不理解神經網路,也不用擔心,因為我們會循序漸進。讓我們開始……

代碼

問題:

研究人員獲取了細針穿刺抽吸活組織檢查(FNA)數據,生成對應的數碼圖像。數據集中包含了描述圖像中的細胞核特性的實例。每個實例標註為「惡性」或「良性」。我們的任務是在這些數據上訓練網路,以診斷乳腺癌。

在Colaboratory中新建一個notebook(untitled.ipynb文件)。

正如我們前面提到的,notebook背後是一個虛擬linux機器,因此你可以安裝項目所需的軟體包。現在就來試一下,在代碼塊中輸入!ls(記得在所有命令前加!):

接下來我們上傳數據集:

輸入!ls檢查下文件是否就緒:

數據處理:

導入數據集(使用pandas):

分離因變數和自變數:

包含單獨的一列,其中有兩個類別M和B,分別代表「惡性」和「良性」。它們需要被編碼為相應的數學形式,即和。這可以通過LabelEncoder類(標籤編碼器)實現。

(如果你的數據包含超過2個類別,你可以使用OneHotEncoder)

數據就緒之後,讓我們切分訓練集和測試集。我們使用Scikit-Learn中的類:

參數定義了測試集的比例。也就是80%作為訓練集,20%作為測試集。

Keras

Keras是構建神經網路的高層API,底層操作基於Tensorflow。因此,安裝Keras前先要安裝Tensorflow。Colaboratory的虛擬機已經預裝了Tensorflow。輸入以下命令可以查看當前安裝的Tensorflow版本:

我希望本文可以幫助你上手Colaboratory。本文配套的Notebook在此(https://colab.research.google.com/notebook#fileId=1aQGl_sH4TVehK8PDBRspwI4pD16xIR0r)。

原文地址:https://towardsdatascience.com/neural-networks-with-google-colaboratory-artificial-intelligence-getting-started-713b5eb07f14


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

初出茅廬,智斗黑澀會!
治癒小故事(三)

TAG:全球大搜羅 |