CVPR 2018摘要：第三部分

新聞 11-24

本文為 AI 研習社編譯的技術博客，原標題：
NeuroNuggets: CVPR 2018 in Review, Part III
作者 | Sergey Nikolenko、Aleksey Artamonov
翻譯 | 老趙校對 | 醬番梨
整理 | 菠蘿妹

原文鏈接：
https://medium.com/neuromation-io-blog/neuronuggets-cvpr-2018-in-review-part-iii-82a5a3129caf

NeuroNuggets：CVPR 2018年回顧，第三部分

CVPR 2018（計算機視覺和模式識別）會議已經結束，但我們不能停止回顧其精彩的論文; 今天，我們學習第三部分。在第一部分中，我們簡要回顧了2018年CVPR中關於計算機視覺GAN的最有趣的論文; 在第二部分中，增加了人性化，並談到了人類的姿勢估計和跟蹤。今天，我們轉向Neuromation中內部研究的主要焦點之一：合成數據。像往常一樣，論文沒有特別的順序，我們的評論非常簡短，所以我們絕對建議完整閱讀論文。

合成數據：模仿學習

合成數據是指通過3D建模和渲染（通常用於計算機視覺）或通過其他方式人工生成的數據，然後用於訓練機器學習模型。合成數據在機器學習中是一個令人驚訝的主題，最令人驚訝的是它被忽略了多長時間。有關合成數據的一些著作可以追溯到2000年代，但在2016年之前它基本上沒有引起任何興趣。它所使用的唯一領域是訓練自動駕駛汽車，對模擬環境的需求和收集真實數據集的不可能性使其成為合成數據集的完美情況。

現在興趣正在迅速增長：我們現在擁有模擬室內環境的SUNCG數據集，用於駕駛和導航的室外環境，用於學習姿勢估計和跟蹤的合成人的SURREAL數據集，以及甚至最近應用GAN來生成和改進合成的數據（我們希望回到這一點並解釋它之後的工作原理）。那麼讓我們看看CVPR 2018作者對合成數據的看法。由於這是我們的主要關注點，因此我們將比通常更詳細地考慮合成數據的工作。

從GAN生成合成數據：特徵空間中的增強和自適應

R. Volpi等人，無監督域適應的對抗特徵增強S. Sankaranarayanan等人，生成適應：對齊域使用生成性對抗網路

CVPR 2018摘要：第三部分

打開今日頭條，查看更多精彩圖片

有一個非常有趣和有前途的領域，即使用GAN生成合成數據集來訓練其他模型。從表面上看，沒有多大意義：如果你有足夠的數據訓練GAN，為什麼不用它來訓練模型呢？或者甚至更好，如果你有一個訓練有素的GAN，你為什麼不採取鑒別器並將它用於你的問題？

但是這個想法在自適應域設置中變得更加有趣。假設你有一個大的源數據集和一個小的目標數據集，並且需要使用針對目標的源數據集訓練的模型，該模型可能完全沒有標記。這裡，對抗域適應技術訓練兩個網路，一個生成器和一個鑒別器，並用它來確保網路不能在源數據集和目標數據集中的數據分布之間進行壓縮。這個領域是在Ganin和Lempitsky的ICML2015論文中開始的，其中使用鑒別器來確保這些特徵保持域不變：

CVPR 2018摘要：第三部分

以下是2017年對抗性判別領域適應論文中這一想法如何略微概括的示意圖：

CVPR 2018摘要：第三部分

在Volpi等人的CVPR 2018論文中，來自義大利和斯坦福的研究人員使對抗訓練不是在原始圖像上，而是在特徵空間本身。 GAN對預訓練網路提取的特徵進行操作，這使得有可能實現更好的域不變性並最終提高域適應的質量。以下是Volpi等人改編的整體培訓程序：

CVPR 2018摘要：第三部分

另一種方法是由Sankaranarayanan等人在馬里蘭大學的研究人員在2018年的CVPR中提出的。他們使用GAN來利用無監督數據，使源和目標分布在特徵空間中彼此更接近。基本上，該想法是使用鑒別器來控制從嵌入產生的圖像保持用於源分布的真實圖像，即使嵌入是從目標分布的樣本中獲取的。以下是它的工作原理，作者再次報告了改進的域適應結果：

CVPR 2018摘要：第三部分