為什麼遷移學習的前景這麼大？為什麼PyTorch這麼火？

科技 06-04

圖：pixabay

機器學習的未來是非常光明的，為什麼這麼講？因為導致機器學習大發展的激勵因素幾乎是一致的——大廠商們熱切地開源各種工具，開始在更快的硬體領域投資，改變他們原先基於廣告的商業模式。那些瘋狂的科學家們（tinkerers）發明出了以前聞所未聞的應用程序。私人、公共、科學、閑置和不可利用的數據，可互換性越來越高。那麼我們討論一些實際的事情吧：我們到底怎樣利用最近機器學習上的提升——那些可用的、預先訓練的機器學習模型呢？

與遷移學習相關的任務需要一小部分潛在的能力，來區分不可見的數據。例如，無論你彈吉他還是鋼琴，你都會比沒有玩過這些樂器的人更好地選擇和弦。從機器學習的角度來說，這意味著你可以複製別人的訓練工作，並將其快速應用到分類照片。

吳恩達曾在2016年的神經信息處理系統大會（NIPS2016）上，總結概括了機器學習的高速發展。

特別需要說明的是，遷移學習在決定機器學習技術的所有方面都有所改進。

人力效率：如果你想要輸出最後的信號，使模型可解釋，易處理，並具有魯棒性，你需要專家。得益於學術研究，各種架構在相關任務中不斷進行測試，爆炸式增長。

計算效率：目前，以最先進的論文而言，在2到8個GPU的群集上進行訓練通常大約需要兩周。但是，通過遷移學習，你可以節省很多調整內部參數的過程。

數據效率：如果對大數據集進行訓練，在大多數情況下，需要更少域的特定數據。

遷移學習被廣泛用於區分具體的圖像類別。普渡大學的Alfredo Canziani和Eugenio Culurciello曾在2016年5月發表過一篇名為《深度神經網路模型實際應用分析》的論文，該論文比較了在imagenet數據集上計算時，主要架構的計算效率。

具體來說，根據你的設備限制，你可以進一步將計算成本分為訓練時間、推理時間和內存需求。我們需要深入挖掘，給出非常具體的約束。

首先，新的數據經常出現；其次，這些圖像也具有潛在的專有性。因此，再訓練過程必須在本地的中層GPU上進行，以保證可靠性。從用戶的角度來看，如果在一致的時間內給出一致的結果，再訓練就是可靠的。因此，基線基準測試將使用一個簡單的優化方法，有利於收斂的數據效率。再其次，每個預測需要幾乎實時地發生，因此我們還要關注推理時間。最後，我們關注圖像（或圖像的一部分）的確切類別作為決策的輸入。這樣，我們將top-1 accuracy考慮在內。

現在，為了降低專家的成本，隨著不斷發展的數據集，將計算時間與硬性約束相適應，讓我們研究一下最令人垂涎的工具之一——PyTorch。

為什麼PyTorch這麼火爆呢？

框架合理完整、簡潔、完全在代碼中定義，並易於調試。只需要添加一行代碼，就可以從torchvision軟體包載入6種框架：AlexNet、DenseNets、Inception、SqueezeNet和VGG。

圖表中的模型僅在最終層（淺），整個參數集（深）或從其初始化狀態（從零開始）進行了再訓練。在所有運行中，雙K80 GPU大約運行在75％。

數據顯示，SqueezeNet 1.1是高效的計算架構。因為想分成再訓練和靜態層次比較難，所以只是基於淺層再訓練模型的結論太隨意了。例如，VGG13的最終分類器具有8194個參數，而ResNet34的最終層比較窄，具有1026個參數。因此，只有對學習策略的超參數搜索才能使給定目標的比較真正有效。

需要注意的是，在相同訓練時間下，與淺層再訓練相比，深層再訓練時間的精確度要低得多。在其他任務中，其他模型也遇到了相似的事情。從前一個局部最優化的角度來看，更深層次的卷積平均（小誤差梯度）發生緩慢，並且在比隨機初始化的情況下更不平滑。因此，參數可能最終在過渡階段並列。如果未知的特徵與原始數據不同，這種間歇性混亂應該是特別真實的，下圖就是一個例子：有時候有螞蟻靠近，有時你觀察到整個蟻群。

因此，事實上，你可能會建議提高深層再訓練的學習率，或者在某種程度上使用規模不變網路（scale invariant networks）https://github.com/msracver/Deformable-ConvNets。

為了評估由推理和再訓練時間組成的計算效率，這是一個很好的開始。如果你想進一步提高再訓練效率，你可以忽略數據增強，從未訓練層中提取結果。當然，結論將會隨著類別數、前面提到的其他因素，以及其他具體的限制而不同。

編譯自：towards datascience

作者：Alexander Hirner

文章做了不改變原意的修改

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器人圈 的精彩文章:

※東京大學MIL提出web瀏覽器上運行最快的DNN框架
※OpenAI：當AlphaGo應用於機器人領域是否戰無不勝？
※照片著色還是個難題？基於貝葉斯優化的順序線搜索技術可輕鬆搞定
※什麼是激活函數？有哪些類型？哪個更好用？別急，你要的都在這！
※兒童節那些時間穿梭機帶你去到童年的某一天

TAG:機器人圈 |

您可能感興趣

※換新 iPhone 了，如何一鍵遷移數據？
※遷移學習不好懂？這裡有一個PyTorch項目幫你理解
※案例研究：為什麼要從MySQL遷移到Aurora？
※將 TensorFlow 訓練好的模型遷移到 Android APP上
※又一項目從Ethereum遷移至NEO
※遷移學習:如何使用TensorFlow機器學習對圖像進行分類？
※Entity Framework Core 之資料庫遷移
※微軟終於動手了，LinkedIn正在向Azure遷移
※機器學習如何從Python 2遷移到Python 3
※機器學習如何從Python 2遷移到Python 3
※不想 iPhone 數據存在「雲上貴州」？手把手教你遷移 iCloud 數據
※數據源從druid遷移到HikariCP
※特別報告：Kubernetes正醞釀著一場向雲的大規模遷移
※TensorFlow.js、遷移學習與AI產品創新之道
※從Python遷移到Go的原因和好處
※遷移學習之Domain Adaptation
※官方Twitter賬號遷移，索尼移動要開始去「Xperia」化？
※Day041 Transfer Learning 遷移學習
※換上新 iPhone 前，舊設備上的數據該如何遷移？
※零示例學習中的映射域遷移 (projection domain shift) 問題