當前位置:
首頁 > 知識 > 《深度學習》中譯版讀書筆記:GitHub項目等你來Fork

《深度學習》中譯版讀書筆記:GitHub項目等你來Fork

機器之心報道

參與:蔣思源

前一段時間,深度學習中譯版已經正式出版並得到廣泛的關注,我們在閱讀中譯版時可能需要查閱各種額外的擴展知識並整理成筆記以便進一步複習。但是近日有很多讀者在深度學習中譯版項目的 GitHub 目錄下創建了一個新項目,該項目旨在記錄和整理 Deep Learning 這本書的學習筆記和實現代碼。機器之心將簡要介紹該項目,並希望能與各位讀者共同學習並完善該書的學習資源。

項目地址:https://github.com/exacity/simplified-deeplearning

Deep Learning 這本書的中譯版給我們的感覺是質量非常高,例如在英文原版中的第四章「Numerical Computation」中,出現了很多「maximum」和「minimum」,這兩個詞在中譯版中都有十分正確的翻譯。因為「maximum」可以表示最大值也可以表示極大值,這兩個概念在數學上是不同的,而中譯本根據語境很好地區分了這兩個術語。這只是很小的一個細節,但讓我們感受到了中譯本的嚴謹與高質量。

機器之心的小夥伴們也在閱讀這本書籍,在閱讀的過程中可能需要增加很多的額外知識以完成筆記例如在第三章概率與資訊理論中,我們可能需要查找各種離散型和連續型概率分布函數、確定概率質量函數與以前我們熟悉的概率分布函數有什麼關係、確定獨立性的分布函數條件和數字特徵之間的運算關係等等,這樣我們才能整理出比較完善的筆記以便於以後的複習。

但是在近日開展的這個 GitHub 項目中,我們可以輕易地找到各種精要知識與代碼實現,比如在第三章的筆記中比較了各種分布在不同參數下的情況:

上圖展示了高斯分布(正態分布)在不同均值μ和標準差σ下的概率密度函數,這樣我們可以對高斯分布及參數的影響有一個直觀的概念。

同樣上圖為拉普拉斯分布在不同參數下的概率密度函數,這些資源不僅有助於我們理解 Deep Learning 這本書的內容,同時還有助於我們根據這些知識點進行複習。

除此之外,還有很多實現代碼更是理解相關概念的不二選擇,例如我們在該 GitHub 項目的第一章節中發現了很多有助於理解矩陣運算的實現:

在上面的代碼中,我們可以清楚地了解矩陣乘法是如何進行的,首先 A 是一個 2×3 矩陣,B 是一個 3×2 矩陣,使用 Numpy 庫的矩陣乘法函數可以相乘得出 3×3 的矩陣。

在上面的代碼中,我們能了解如何對可逆矩陣執行求逆操作。設 A 為 2×2 可逆矩陣(即矩陣 A 的行列式不為零),我們可以使用 Numpy 庫的矩陣求逆函數對 A 執行求逆操作。

除此之外,機器學習章節也會介紹 TensorFlow 的實戰,讀者在理解理論知識的同時可以了解實現方面的基礎,如下該部分簡要介紹了 TensorFlow:

上面一段代碼定義了兩個計算,即隨機生成 x_1、x_2(服從正態分布)之後分別做加法和乘法,在 TensorFlow 中,這就定義了一個計算圖,這個計算圖可表示如下:

當然,還有很多的模型實現代碼,不過這一部分並不是很全,還需要大家共同努力以完善這些代碼與整個項目。這一部分模型的代碼很多都是引用自十分流行的 GitHub 項目,例如 LSTM 章節中就引用了 Jipeng Huang 完成的 LSTM 唐詩生成器。

這一個 GitHub 項目對於 Deep Learning 中譯本讀者有十分重要的作用,我們不僅可以從上面獲取相應的知識,同時還可以貢獻我們的筆記和擴展理解,這對於各位讀者來說可以是一個相互交流的平台。雖然深度學習讀書筆記這一項目已經搭建起來了,但還有很多內容和理解需要我們去補充和完善。所以,我們希望能與各位讀者共同促進該項目的茁壯成長!

以下是該項目的前言和貢獻者:

前言

作為人工智慧領域目前的最大研究熱點,同時也是近年來為各種智能任務帶來最大突破的技術方向 – 深度學習或者說神經網路正吸引著無數研究人員的眼球。事實上,傳統的神經網路結構和演算法早在上個世紀就已經被提出,但由於當時的任務需求仍遠未達到傳統機器學習演算法的瓶頸,同時神經網路演算法也受限於計算和數據資源,因此並未被普遍關注。

近些年來,依靠人工設計高質量特徵的傳統機器學習演算法在語音識別、自然語言處理以及圖像處理等方面逐漸達到瓶頸,人們開始將目光重新轉向神經網路,利用已經積累的大量數據資源在這一系列智能任務上取得了突破性的進展。包括語音識別、語義理解、圖像識別等在內的研究領域中目前 state-of-the-art 的結果幾乎清一色的都是採用了基於深度學習的方法。同時,GPU 強大的並行計算能力以及包括 TensorFlow、MXNet、Pytorch 等在內的一系列深度學習框架的推出也為研究者和應用開發者提供了極大便利。

DeepLearningBook 是目前第一本系統和完整的介紹深度學習的書籍,其作者包括深度學習領域的奠基人、處於研究生涯中期的領域中堅、更有近年來湧現的新星,非常適合搭建理論基礎。但是直至去年,本書只有英文原版,對於大多數開發者來說,啃一本 800 頁 7*9 英寸的書籍,難度可想而知。好消息是,在翻譯人員的不懈努力下,DeepLearningBook 中文版也已在 GitHub 上公開,中文翻譯版已經由人民郵電出版社出版。

這個項目記錄了我們對 DeepLearningBook 的學習筆記,我們按照全書的脈絡對 Deep Learning 的基礎框架進行了梳理和學習,同時將會附上使用 TensorFlow 實現的相關代碼。

GitHub 的 markdown 不再支持 tex 公式的解析顯示,使用 Chrome 的同學可以安裝 GitHub with MathJax 添加 MathJax 的解析以對公式正常顯示。

持續更新中,歡迎貢獻簡單易懂便於理解的代碼示例,推薦使用 Tensorflow 和 Jupyter Notebook 提交代碼和說明,詳見:如何貢獻代碼。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

AI演算法通過照片識別同性戀準確率超過人類,斯坦福大學研究惹爭議
人工智慧+區塊鏈公司DeepBrain獲3200萬元首輪融資
Facebook聯合微軟推出神經網路交換格式ONNX:不同框架間模型遷移
知網(HowNet)知識庫的簡單調用指南
從產品到AI平台,智能管家ROOB 獲3.5億元B輪融資

TAG:機器之心 |