用Kaggle經典案例教你用CNN做圖像分類！

知識 07-24

歡迎大家參與在留言區交流

AI 研習社兩大福利就在文末！

不可錯過~

AI 研習社按：本文原作者天雨粟，原文載於作者的知乎專欄——機器不學習，AI 研習社經授權發布。

前言

在上一篇專欄《利用卷積自編碼器對圖片進行降噪》中，我們利用卷積自編碼器對 MNIST 數據進行了實驗，這周我們來看一個 Kaggle 上比較經典的一個圖像分類的比賽 CIFAR( CIFAR-10 - Object Recognition in Images)，這個比賽現在已經關閉了，但不妨礙我們來去通過它學習一下卷積神經網路做圖像識別的代碼結構。相信很多學過深度學習的同學都嘗試過這個比賽，如果對此比較熟悉的可以跳過本篇，如果沒有嘗試過的同學可以來學習一下哈。

整個代碼已經放在了我的 GitHub 上，建議可以把代碼 pull 下來，邊看文章邊看代碼。

GitHub 地址：NELSONZHAO/zhihu

如果覺得有幫助，麻煩點個 star 啦~

介紹

文章主要分為兩個部分，第一部分我們將通過一個簡單的 KNN 來實現圖像的分類，第二部分我們通過卷積神經網路提升整個圖像分類的性能。

第一部分

提到圖像分類，我們可能會想到傳統機器學習中 KNN 演算法，通過找到當前待分類圖像的 K 個近鄰，以近鄰的類別判斷當前圖像的類別。

由於我們的圖像實際上是由一個一個像素組成的，因此每一個圖像可以看做是一個向量，那麼我們此時就可以來計算向量（圖片）之間的距離。比如，我們的圖片如果是 32x32 像素的，那麼可以展開成一個 1x1024 的向量，就可以計算這些向量間的 L1 或者 L2 距離，找到它們的近鄰，從而根據近鄰的類別來判斷圖像的類別。

以下例子中 K=5。

下面我們就來用 scikit-learn 實現以下 KNN 對圖像的分類。

首先我們需要下載數據文件，網址為 https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz。我們數據包含了 60000 萬圖片，每張圖片的維度為 32 x 32 x 3，這些圖片都有各自的標註，一共分為了以下十類：

airplane

automobile

bird

cat

deer

dog

frog

horse

ship

truck

數據是被序列化以後存儲的，因此我們需要使用 Python 中的 pickle 包將它們讀進來。整個壓縮包解壓以後，會有 5 個 data_batch 和 1 個 test_batch。我們首先把數據載入進來：

我們定義了一個函數來獲取 batch 中的 features 和 labels，通過上面的步驟，我們就可以獲得 train 數據與 test 數據。

我們的每個圖片的維度是 32 x 32 x 3，其中 3 代表 RGB。我們先來看一些這些圖片長什麼樣子.

每張圖片的像素其實很低，縮小以後我們可以看到圖片中有汽車，馬，飛機等。

構造好了我們的 x_train, y_train, x_test 以及 y_test 以後，我們就可以開始建模過程。在將圖片扔進模型之前，我們首先要對數據進行預處理，包括重塑和歸一化兩步，首先將 32 x 32 x 3 轉化為一個 3072 維的向量，再對數據進行歸一化，歸一化的目的在於計算距離時保證各個維度的量綱一致。

到此為止，我們已經對數據進行了預處理，下面就可以調用 KNN 來進行訓練，我分別採用了 K=1,3,5 來看模型的效果。

從 KNN 的分類準確率來看，是要比我們隨機猜測類別提高了不少。我們隨機猜測圖片類別時，準確率大概是 10%，KNN 方式的圖片分類可以將準確率提高到 35% 左右。當然有興趣的小夥伴還可以去測試一下其他的 K 值，同時在上面的演算法中，默認距離衡量方式是歐式距離，還可以嘗試其他度量距離來進行建模。

雖然 KNN 在 test 數據集上表現有所提升，但是這個準確率還是太低了。除此之外，KNN 有一個缺點，就是所有的計算時間都在 predict 階段，當一個新的圖來的時候，涉及到大量的距離計算，這就意味著一旦我們要拿它來進行圖像識別，那可能要等非常久才能拿到結果，而且還不是那麼的准。

第二部分

在上一部分，我們用了非常簡單的 KNN 思想實現了圖像分類。在這個部分，我們將通過卷積神經網路來實現一個更加準確、高效的模型。

載入數據的過程與上一部分相同，不再贅述。當我們將數據載入完畢後，首先要做以下三件事：

對輸入數據歸一化

對標籤進行 one-hot 編碼

構造訓練集，驗證集和測試集

對輸入數據歸一化

在這裡我們使用 sklearn 中的 minmax 歸一化。

首先將訓練數據集重塑為 [50000, 3072] 的形狀，利用 minmax 來進行歸一化。最後再將圖像重塑回原來的形狀。

對標籤進行 one-hot 編碼

同樣我們在這裡使用 sklearn 中的 LabelBinarizer 來進行 one-hot 編碼。

構造 train 和 val

目前我們已經有了 train 和 test 數據集，接下來我們要將載入進來的 train 分成訓練集和驗證集。從而在訓練過程中觀察驗證集的結果。

我們將訓練數據集按照 8：2 分為 train 和 validation。

卷積網路

完成了數據的預處理，我們接下來就要開始進行建模。

首先我們把一些重要的參數設置好，並且將輸入和標籤 tensor 構造好。

img_shape 是整個訓練集的形狀，為 [40000, 32, 32, 3]，同時我們的輸入形狀是 [batch_size, 32, 32, 3]，由於前面我們已經對標籤進行了 one-hot 編碼，因此標籤是一個 [batch_size, 10] 的 tensor。

接下來我們先來看一下整個卷積網路的結構：

在這裡我設置了兩層卷積 + 兩層全連接層的結構，大家也可以嘗試其他不同的結構和參數。

conv2d 中我自己定義了初始化權重為 truncated_normal，事實證明權重初始化對於卷積結果有一定的影響。

在這裡，我們來說一下 conv2d 的參數：

輸入 tensor：inputs_

濾波器的數量：64

濾波器的 size：height=2, width=2, depth 默認與 inputs_的 depth 相同

strides：strides 默認為 1x1，因此在這裡我沒有重新設置 strides

padding：padding 我選了 same，在 strides 是 1 的情況下，經過卷積以後 height 和 width 與原圖保持一致

kernel_initializer：濾波器的初始化權重

在這裡講一下卷積函數中的兩種常見 padding 方式，分別是 valid，same。假設我們輸入圖片長和寬均為 h，filter 的 size 為 k x k，strides 為 s x s，padding 大小 = p。當 padding=valid 時，經過卷積以後的圖片新的長（或寬）為

；當 padding=same 時，經過卷積以後

。但在 TensorFlow 中的實現與這裡有所區別，在 TensorFlow 中，當 padding=valid 時，

；當 padding=same 時，

。

其餘參數類似，這裡不再贅述，如果還不是很清楚的小夥伴可以去查看官方文檔。

在第一個全連接層中我加入了 dropout 正則化防止過擬合，同時加快訓練速度。

訓練模型

完成了模型的構建，下面我們就來開始訓練整個模型。

在訓練過程中，每 100 輪列印一次日誌，顯示出當前 train loss 和 validation 上的準確率。

我們來看一下最終的訓練結果：

上圖是我之前跑的一次結果，這次跑出來可能有所出入，但準確率大概會在 65%-70% 之間。

最後在 validation 上的準確率大約穩定在了 70% 左右，我們接下來看一下在 test 數據上的準確率。下面的代碼是在 test 測試準確率的代碼。

我們把訓練結果載入進來，設置 test 的 batchs_size 為 100，來測試我們的訓練結果。最終我們的測試準確率也基本在 70% 左右。

總結

如果覺得有用，請記得給 GitHub 打一個 Star，非常感謝！

新人福利

【超過 1000G 神經網路／AI／大數據、教程、論文！】

福利二：本周內（截止至 7 月 23 日晚 24 點）

本公眾號本周發布的所有文章

在文章底部留言評論，獲得最多贊的社友，

社長將送出西瓜書（《機器學習》周志華）1 本

點擊展開全文

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自唯物的精彩文章:

※利用卷積自編碼器對圖片進行降噪
※7個深度神經網路可視化工具，不可錯過！
※用python 6步搞定從照片到名畫，你學你也可以
※現在的AI演算法真的模擬了人腦嗎？
※傳統程序員要不要轉行到AI？看完本文思路更清晰

TAG:唯物 |

您可能感興趣

※GIF圖解 — NBA幾款經典crossover突破技術
※狗年賀歲誰最走心？NIKE AIR FORCE 1 「Year of the Dog」重現經典！
※經典傳承 NIKE Air Force 1 「Hong Kong」近賞
※狗年賀歲誰最走心？NIKE 「Year of the Dog」重現經典！
※經典回歸！NIKE即將發布「Safari」 Pack
※經典音樂《 You Belong With Me ?》你應該和我在一起
※經典黑紅！Nike SB Dunk High 「Bred」曝光
※以習俗詮釋經典｜adidas PW Hu Holi Stan Smith ｜Xsneaker
※經典三色，EQT Cushion ADV 「Tri-Color」
※權志龍最愛的Dr.Martens，這次COMME des GAR?ONS重新設計比經典款還要潮！
※致敬經典！AJ3 All-Star「Dunk Series」
※Champion 控告街頭品牌 Hudson Outerwear 侵犯經典 Logo 版權
※Nike Air Max 1 經典配色「Obsidian」即將回歸！
※極罕鞋款，經典美劇《Friends》x Nike Air Edge 聯名實物
※經典重塑致敬歷史 adidas Crazy 1 ADV
※經典機種不死，MacBook Air 搭載 Retina 面板重生後如何定位？
※SUP經典聯名與嘻哈結合！Supreme x Undercover 或將下周發售
※另一種選擇小眾Woolrich Wool Patrol Down 經典 Parka 鵝絨大衣
※經典重塑，NikeAirMax93OG全新配色「DustyCactus」
※經典重塑，Nike Air Max 93 OG 全新配色「Dusty Cactus」