吳恩達《ML Yearning》52章譯文,一份很有誠意的GitHub項目
機器之心整理
作者:xiaqunfeng
近日,有開發者在 GitHub 上給出了吳恩達《Machine Learning Yearning》的非官方譯文。作者 xiaqunfeng 表示這個項目是在邊學邊翻的過程中構建的,且目前已經完成了前面 52 章的翻譯。這個項目主要在於提供學習交流,中間的表述或翻譯也會有一些誤差,讀者可詳細查閱譯文並提供修正意見。
在該 GitHub 項目中,讀者可直接下載各章節譯文的 MarkDown 文檔,也可以下載 PDF 版的英文原版。此外為了有更好的閱讀體驗,作者為這個項目構建了 GitBook,讀者可直接在線閱讀。
- 原書官網:http://www.mlyearning.org/
- 項目地址:https://github.com/xiaqunfeng/machine-learning-yearning
- 書籍地址:https://xiaqunfeng.gitbooks.io/machine-learning-yearning/content/
這本書的目的是教你如何做組織一個機器學習項目所需的大量的決定。
你將學習:
- 如何建立你的開發和測試集
- 基本錯誤分析
- 如何使用偏差和方差來決定該做什麼
- 學習曲線
- 將學習演算法與人類水平的表現進行比較
- 調試推理演算法
- 什麼時候應該和不應該使用端到端的深度學習
- 按步進行錯誤分析
已翻譯章節
第一章:為什麼是機器學習策略
第二章:如何使用這本書來幫助你的團隊
第三章:預備知識和注釋
第四章:規模驅使機器學習前進
配置開發與測試集
第五章:您的開發和測試集
第六章:你的開發集和測試集應該來自相同的分布
第七章:開發集/測試集需要多大?
第八章:為你的團隊進行演算法優化建立一個單一數字的評估指標
第九章:優化指標和滿足指標
第十章:有一個開發集和評估指標來加速迭代
第十一章:何時更改開發/測試集和評估指標
第十二章:小結:建立開發集和測試集
基本誤差分析
第十三章:快速構建第一個系統,然後迭代
第十四章:錯誤分析:查看開發集樣本來評估 idea
第十五章:在錯誤分析過程中並行評估多個想法
第十六章:清理貼錯標籤的開發和測試集樣本
第十七章:如果你有一個大的開發集,將其分成兩個子集,只著眼於其中的一個
第十八章:Eyeball 和 Blackbox 開發集應該多大?
第十九章:小貼士:基本錯誤分析
偏差和方差
第二十章:偏差和方差:錯誤的兩大來源
第二十一章:偏差和方差的例子
第二十二章:比較最優錯誤率
第二十三章:處理偏差和方差
第二十四章:偏差和方差間的權衡
第二十五章:減少可避免偏差的方法
第二十六章:訓練集上的錯誤分析
第二十七章:減少方差的方法
學習曲線
第二十八章:診斷偏差和方差:學習曲線
第二十九章:繪製訓練錯誤曲線
第三十章:解讀學習曲線:高偏差
第三十一章:解釋學習曲線:其他情況
第三十二章:繪製學習曲線
對比人類水平性能
第三十三章:為什麼我們要比較人類水平的表現
第三十四章:如何定義人類的表現
第三十五章:超越人類表現
在不同分布上訓練和測試
第三十六章:何時應該在不同的分布下訓練和測試
第三十七章:如何決定是否使用所有數據
第三十八章:如何決定是否包含不一致的數據
第三十九章:加權數據
第四十章:從訓練集到開發集的泛化
第四十一章:識別偏差、方差和數據不匹配錯誤
第四十二章:處理數據不匹配
第四十三章:人工數據合成
調試推理演算法
第四十四章:優化驗證測試
第四十五章:優化驗證測試的一般形式
第四十六章:強化學習案例
端到端深度學習
第四十七章:端到端學習的興起
第四十八章:更多端到端學習示例
第四十九章:端到端學習的優點和缺點
第五十章:選擇流水線組件:數據可用性
第五十一章:選擇流水線組件:任務簡單
第五十二章:直接學習豐富的輸出
更新記錄:
- update 2018.04.25:NG 終於出 15~19 章的手稿啦,等的好辛苦(DONE)
Tips:在原先的 12 章和 13 章之間新增一個章節 13 Build your first system quickly, then iterate,原先的 chapter13 變為 14,chapter14 變為 15
- update 2018.05.02:手稿 20~22 章已出(DONE)
- update 2018.05.09:手稿 23~27 章已出(DONE)
- update 2018.05.16:手稿 28~30 章已出(DONE)
- update 2018.05.23:手稿 31~32 章已出(DONE)
- update 2018.05.30:手稿 33~35 章已出(DONE)
- update 2018.06.06:手稿 36~39 章已出(DONE)
- update 2018.06.13:手稿 40~43 章已出(DONE)
- update 2018.06.20:手稿 44~46 章已出(DONE)
- update 2018.06.27:手稿 47~49 章已出(DONE)
- update 2018.07.04:手稿 50~52 章已出(DONE)
業餘時間翻譯,水平有限,如有不妥或錯誤之處,歡迎不吝賜教。


※圖神經網路+池化模塊,斯坦福等提出層級圖表徵學習
※DeepMind提出關係RNN:記憶模塊RMC解決關係推理難題
TAG:機器之心 |