BigGAN學會「七十二變」:跟著視頻模仿動物,看到啥就能變啥
曉查 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
BigGAN從出現第一天起,就以它逼真的生成圖像征服了各路網友。
這兩天,BigGAN又被開發出了新的玩法。
以前BigGAN只是用來生成靜態圖片,現在它已經學會了孫悟空的「七十二變」。給它一段視頻,它就可以隨著視頻實時變化。
總之,視頻里有啥,它就能變啥。
看我七十二變
作者給圖像生成器輸入了一段BBC《行星地球》紀錄片的視頻,接著模型能輸出猴子、獵豹、企鵝等圖像。
能快速根據視頻內容輸出圖片已經很厲害了,更厲害的還在後面。
它生成可不僅僅是PPT,而是可以隨著視頻中物體的變化,平滑地過渡。在各種鳥類之間從容變換:
還能模仿多種蘑菇:
即使跨物種也不成問題,從企鵝到大象,變化自然:
這段視頻效果驚人,今天凌晨作者在Twitter上放出以後,目前已有300多位網友點贊。有人表示非常喜歡作者的這項研究成果。
但也有細心網友發現了其中的錯誤。
作者表示,現在的Demo僅僅在模仿動物時比較成功,對其他種類物品的理解會出現偏差。比如在上面的視頻中,BigGAN就錯誤地把太陽模仿成了火苗。
有人向作者提問,是否是利用視頻內容對模型進行訓練。作者稱,模型並不是由視頻訓練而來,而是在ImageNet圖片數據集上進行訓練的。
一個會編程的藝術家
開發該項目的作者名叫Gene Kogan,他既是一個藝術家,同時也是程序員,可謂是站在科技與人文的十字路口。他在紐約大學任教,曾開設過一個面向藝術家的機器學習課程。
Gene還創建了ml4a項目,一本面向藝術家、公民科學家的免費機器學習書籍。目前該書還在撰寫中,部分章節已經完成,並且有中文翻譯!
Gene他希望以此促進公眾對計算機視覺領域的了解。
資源地址
ml4a項目地址(有中文):
http://ml4a.github.io/ml4a/
Gene Kogan的GitHub主頁:
https://github.com/genekogan
作者的BigGAN筆記和Demo:
https://colab.research.google.com/drive/1rqDwIddy0eunhhV8yrznG4SNiB5XWFJJ#scrollTo=USNAsSLtqf8N
作者系網易新聞·網易號「各有態度」簽約作者
—完—
活動報名
加入社群
量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。


※當一盆植物在MIT成了精,不,它只是成了機器人
※MIT重新發明飛機:無需燃料,每秒萬米噴射帶你上天
TAG:量子位 |