BigGAN學會「七十二變」：跟著視頻模仿動物，看到啥就能變啥

科技 12-21

曉查發自凹非寺

量子位出品 | 公眾號 QbitAI

BigGAN從出現第一天起，就以它逼真的生成圖像征服了各路網友。

這兩天，BigGAN又被開發出了新的玩法。

以前BigGAN只是用來生成靜態圖片，現在它已經學會了孫悟空的「七十二變」。給它一段視頻，它就可以隨著視頻實時變化。

總之，視頻里有啥，它就能變啥。

看我七十二變

作者給圖像生成器輸入了一段BBC《行星地球》紀錄片的視頻，接著模型能輸出猴子、獵豹、企鵝等圖像。

能快速根據視頻內容輸出圖片已經很厲害了，更厲害的還在後面。

它生成可不僅僅是PPT，而是可以隨著視頻中物體的變化，平滑地過渡。在各種鳥類之間從容變換：

還能模仿多種蘑菇：

即使跨物種也不成問題，從企鵝到大象，變化自然：

這段視頻效果驚人，今天凌晨作者在Twitter上放出以後，目前已有300多位網友點贊。有人表示非常喜歡作者的這項研究成果。

但也有細心網友發現了其中的錯誤。

作者表示，現在的Demo僅僅在模仿動物時比較成功，對其他種類物品的理解會出現偏差。比如在上面的視頻中，BigGAN就錯誤地把太陽模仿成了火苗。

有人向作者提問，是否是利用視頻內容對模型進行訓練。作者稱，模型並不是由視頻訓練而來，而是在ImageNet圖片數據集上進行訓練的。

一個會編程的藝術家

開發該項目的作者名叫Gene Kogan，他既是一個藝術家，同時也是程序員，可謂是站在科技與人文的十字路口。他在紐約大學任教，曾開設過一個面向藝術家的機器學習課程。

Gene還創建了ml4a項目，一本面向藝術家、公民科學家的免費機器學習書籍。目前該書還在撰寫中，部分章節已經完成，並且有中文翻譯！

Gene他希望以此促進公眾對計算機視覺領域的了解。

資源地址

ml4a項目地址（有中文）：

http://ml4a.github.io/ml4a/

Gene Kogan的GitHub主頁：

https://github.com/genekogan

作者的BigGAN筆記和Demo：

https://colab.research.google.com/drive/1rqDwIddy0eunhhV8yrznG4SNiB5XWFJJ#scrollTo=USNAsSLtqf8N

作者系網易新聞·網易號「各有態度」簽約作者

—完—

活動報名

加入社群

量子位AI社群開始招募啦，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字「交流群」，獲取入群方式；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號（QbitAI）對話界面回復關鍵字「專業群」，獲取入群方式。（專業群審核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復「招聘」兩個字。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章: