調戲Google AI的秘籍在此
終於有一款好玩的微信小程序上線啦~
GIF
隨著你不斷下筆,AI會用谷歌娘獨有嗓音不斷改變答案。有時AI猜不出你的畫,也會調侃說:「你畫的啥玩意兒」、「再加把勁」、「我猜是胡寫亂畫」……
對於這個簡單好玩的小程序,很多人表達了讚美:
? 「猜畫小歌太好玩啦!!瘋狂打call! 」
? 「好好玩,我的白痴繪畫能力在被AI懂的那一刻,竟有一絲心動的感覺」
也有很多人不服:
? 「太難了,西蘭花怎麼畫……」
? 「AI問我畫的啥玩意兒……」
? 「我畫得這麼生動形象,為什麼AI識別不出來!大家來評評理!」
確實有一些題目,好多人看完之後一臉懵逼。比方說讓你畫一個蒙娜麗莎,或者畫一個動物遷徙……
GIF
先公布幾個熱門問題的答案
西蘭花:
蒙娜麗莎:
動物遷徙:
其實並不需要你畫得多麼的精巧,哪怕有些簡陋,只要和實際物品有幾分相似,小歌就能快速答對並通關。看得出,號稱「囊括超過 5000 萬個手繪素描數據群」的 Google AI 神經網路驅動相當厲害。
作為一個嚴(較)謹(勁)的業內人士,顯然不滿足於簡單的通關。怎樣騙過AI才是我的終極目標。
經過我的一番研究,發現調戲AI小歌關鍵在兩點:
1.不要一下子畫好輪廓,從局部開始
2.加一些沒啥用的細節上去
為什麼潦草的簡筆畫就能被AI猜中,認真繪畫充滿細節的作品卻失敗了?
這就要說到AI的運作方式了。
AI小歌的工作原理
「猜畫小歌」對你畫作的辨識,利用的是神經網路技術,是基於對大量塗鴉樣本的學習。
塗鴉是人們對事物的抽象表達,只不過,這個抽象對AI來說有點困難。谷歌的研究人員要做的就是,訓練機器像人類一樣學習繪畫和生成抽象的概念。
這裡利用到的技術有一個高大上的名字:RNN,也就是遞歸神經網路。具體實現我就詳細說了,你只需要知道,你即興畫出來的靈魂作品,最後都豐富了谷歌龐大的人類塗鴉數據集。
蘋果的數據已經一大堆了
接下來,研究人員會用人類塗鴉數據來集中訓練神經網路,讓AI來理解人們在繪製塗鴉時是在何時起筆、走筆方向、何時停筆的。經過訓練的RNN模型接收到人類繪製的塗鴉時,就會生成一張類似的新塗鴉:
如果人類提供的塗鴉本身有瑕疵,AI還知道「糾錯」。
在RNN模型中,當研究者輸入參與者創作出的靈魂塗鴉,例如沒眼睛貓、沒鼻子貓和沒鬍子貓,AI仍然能夠重構出「正常」的圖像來。
最後一排明顯是一把刷子,但是模型仍然執著於生成有貓耳朵、貓鬍鬚、貓腳的圖像。
第3排的豬豬,8條腿被修正成了4條腿。
當小歌逐漸理解了人類的塗鴉畫法,你再畫出一幅圖的時候,它就可以根據圖畫猜出很多關鍵詞,當這些關鍵詞中出現題目時,就會說「猜出來了」!
看到這裡,可能有的同學想問:谷歌大費周章開發這個東西難道只是為了愉悅大眾?
當然不是,谷歌表示,發布這個遊戲的目的遠不止讓用戶開心,真正的初衷是收集運用這些用戶的草圖數據。
那麼,這些數據能用來做什麼呢?
1.可以用來收集abstract reasoning的數據,讓計算機學習人如何繪畫;
2.這是可以被作為輪廓識別的寶貴數據。
3.通過比較世界各地人們繪製基本圖形的方式,了解文化對繪畫的影響。
谷歌並沒有私吞這些網友智慧的結晶,截止今年五月,這款遊戲的網頁版quickdraw已經從全球各地收集了五千萬份不同的繪畫,並且在Google上開源了資料庫。這些簡筆畫不僅整理清晰,還被貼心的做好了標註。感興趣的同學可以去github或者谷歌自取數據集哦
您的支持和分享是我們前進的動力
TAG:智股寶 |