當前位置:
首頁 > 科技 > BigGAN學會「七十二變」:跟著視頻模仿動物,看到啥就能變啥

BigGAN學會「七十二變」:跟著視頻模仿動物,看到啥就能變啥

曉查 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

BigGAN從出現第一天起,就以它逼真的生成圖像征服了各路網友。

這兩天,BigGAN又被開發出了新的玩法。

以前BigGAN只是用來生成靜態圖片,現在它已經學會了孫悟空的「七十二變」。給它一段視頻,它就可以隨著視頻實時變化。

總之,視頻里有啥,它就能變啥。

看我七十二變

作者給圖像生成器輸入了一段BBC《行星地球》紀錄片的視頻,接著模型能輸出猴子、獵豹、企鵝等圖像。

能快速根據視頻內容輸出圖片已經很厲害了,更厲害的還在後面。

它生成可不僅僅是PPT,而是可以隨著視頻中物體的變化,平滑地過渡。在各種鳥類之間從容變換:

還能模仿多種蘑菇:

即使跨物種也不成問題,從企鵝到大象,變化自然:

這段視頻效果驚人,今天凌晨作者在Twitter上放出以後,目前已有300多位網友點贊。有人表示非常喜歡作者的這項研究成果。

但也有細心網友發現了其中的錯誤。

作者表示,現在的Demo僅僅在模仿動物時比較成功,對其他種類物品的理解會出現偏差。比如在上面的視頻中,BigGAN就錯誤地把太陽模仿成了火苗。

有人向作者提問,是否是利用視頻內容對模型進行訓練。作者稱,模型並不是由視頻訓練而來,而是在ImageNet圖片數據集上進行訓練的。

一個會編程的藝術家

開發該項目的作者名叫Gene Kogan,他既是一個藝術家,同時也是程序員,可謂是站在科技與人文的十字路口。他在紐約大學任教,曾開設過一個面向藝術家的機器學習課程。

Gene還創建了ml4a項目,一本面向藝術家、公民科學家的免費機器學習書籍。目前該書還在撰寫中,部分章節已經完成,並且有中文翻譯

Gene他希望以此促進公眾對計算機視覺領域的了解。

資源地址

ml4a項目地址(有中文):

http://ml4a.github.io/ml4a/

Gene Kogan的GitHub主頁:

https://github.com/genekogan

作者的BigGAN筆記和Demo:

https://colab.research.google.com/drive/1rqDwIddy0eunhhV8yrznG4SNiB5XWFJJ#scrollTo=USNAsSLtqf8N

作者系網易新聞·網易號「各有態度」簽約作者

活動報名

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

當一盆植物在MIT成了精,不,它只是成了機器人
MIT重新發明飛機:無需燃料,每秒萬米噴射帶你上天

TAG:量子位 |