當前位置:
首頁 > 遊戲 > 你的靈魂畫作都去哪兒了?谷歌「猜畫小歌」背後的5000萬組數據

你的靈魂畫作都去哪兒了?谷歌「猜畫小歌」背後的5000萬組數據

據谷歌介紹,「猜畫小歌」背後的技術主要是計算機視覺和神經網路,由來自Google AI的神經網路驅動。

自從退出中國的搜索引擎市場,谷歌大概無時不刻都想」捲土重來「。昨天,這家以搜索引擎著稱的巨頭公司用一款微信小程序「猜畫小歌」佔領了朋友圈「C位」,刷足存在感的同時,還順便激發了身邊一票「靈魂畫手」。

比如這樣的蒙娜麗莎

或者這樣的美人魚

就別難為小歌了好嗎……

「猜畫小歌」來自Google AI的一款小程序,這也是谷歌第一款微信小程序。據谷歌官方博文介紹,用戶可以和谷歌的AI組隊,在有限的時間內進行速寫。在每一輪體驗中,用戶需要在規定時間內勾勒出一幅日常用品的圖畫(比如狗、鐘錶或鞋子),AI「小歌」則需要在時間結束前猜出圖畫中的物體。

當 AI 猜出你圖畫中的物體時,你就會進入下一輪,你的猜畫連勝次數也會相應增加。你還可以分享有趣的素描圖,並在體驗過程中不斷收集新的題目和圖畫。

據谷歌介紹,「猜畫小歌」背後的技術主要是計算機視覺和神經網路,由來自Google AI的神經網路驅動。

當然,在畫的停不下來的同時,不少人也充滿遺憾,谷歌的這個微信小程序,只是為了在中國刷刷久違的存在感嗎?

當然沒有這麼簡單。

其實,這隻小程序並非中國首發,早在去年11月,谷歌就上線了一款叫「Quick,Draw!」的線上遊戲,也就是「猜畫小歌」的網頁原版。這款遊戲中,玩家也需要在一定時間(20秒內)畫出要求的圖案,比如駱駝或洗衣機之類的。

遊戲界面傳送門:

https://quickdraw.withgoogle.com/

這款網頁版遊戲目前仍然可用,如果在中國大陸的你懂得科學上網,可以點擊上邊的鏈接進入,感受一下用滑鼠畫圖的難度,絕對比手指畫要艱難許多了。

當然,谷歌后來表示,發布這個遊戲的目的遠不止讓用戶開心,真正的初衷是運用這些草圖,讓計算機學習人如何繪畫。(意味深長啊)

大方的谷歌並沒有私吞這些網友智慧的結晶,截止今年五月,這款遊戲的網頁版已經從全球各地收集了五千萬份不同的繪畫,並且在谷歌上開源了資料庫。

這些簡筆畫不僅整理清晰,還被貼心的做好了標註。感興趣的同學可以去github或者谷歌自取數據集哦

數據集github鏈接:

https://github.com/googlecreativelab/quickdraw-dataset

數據集谷歌鏈接:

quickdraw.withgoogle.com/data

這一數據集包含了來自全球100多個國家和地區人們的繪畫數據,據谷歌消息,這些數據也被用來優化了本次微信小遊戲「猜畫小歌」的開發。

但是,基於谷歌網站在中國的境況,中國大陸的畫作數據遺憾缺失。

不過,本次谷歌微信小程序上線後,中國畫手的信息終於可以補充進來啦,感興趣的同學也可以坐等數據集的更新了。

想到自己的畫作還能被收錄進入資料庫,為人工智慧和人類的進步作出一份微薄貢獻,是不是有點小激動呢?

那麼,這些數據能用來做什麼呢?文摘菌深夜諮詢了一些科技咖們,得到了很多有趣的猜測:

比如,剛剛從日本回來的Andy同學就認為,可以用來收集abstract reasoning的數據,讓機器了解什麼是貓;

又比如,來自斯坦福的Q同學覺得,這是可以被作為輪廓識別的寶貴數據。

除了這些在人工智慧中的寶貴效用,以數據新聞著稱的海外科技媒體Quartz和兩位記者,從更人文的角度,給出了一些不太一樣的研究思路:他們希望通過比較世界各地人們繪製基本圖形的方式,了解文化對繪畫的影響。

這要得益於谷歌完備的資料庫,這一資料庫不僅包含了來自148個國家和地區的人所畫的11.9萬個不同的圓,也記錄了每個玩家的手指(或滑鼠)經過路線的坐標。

通過對其中從66個不同國家收集的100多個圓進行一些簡單的幾何分析,他們發現,不同國家的人習慣於不同的畫圓方向:

美國人喜歡逆時針畫圓,在近5萬個美國人所畫的圓中有86%是逆時針畫的。恰恰相反,日本人更多習慣於順時針畫圓,800個日本人畫的圓中有80%是順時針畫的。

下圖是100個來自不同國家和地區的人所畫的圓的隨機抽樣。

英國,捷克,澳大利亞和芬蘭人跟美國人有大致相同的比例逆時針畫圓。

法國,德國和菲律賓人甚至有更高的比例-大致90%去逆時針畫圓。在越南,95%的人逆時針畫圓。

Quartz分析的資料庫顯示,大部分國家和地區的人更傾向於逆時針畫圓,唯獨兩個例外:台灣和日本。

這一項目的成果在一年前發布在Quartz上

https://qz.com/994486/the-way-you-draw-circles-says-a-lot-about-you/

*大數據文摘在去年十二月已經發布了Quartz這篇文章的編譯版,重刊如下,感興趣的同學可以繼續閱讀。

如何解釋這種差異呢?Quartz也做出了自己的猜測。

一個顯而易見的原因是不同國家的語言。人們書寫文字的不同方式,從上到下,從左到右或是從右到左,是否能夠解答他們繪畫方式的不同呢?美國,西歐和拉丁美洲人的口語雖有差別,但書寫方式大致相同。然而亞洲和中東卻有著與上述國家截然不同的書面文字。

下面幾幅圖展示了一些代表性文字的書寫方式:

比如,先來看看日語中的文字。這裡展示了日語中三種文字元號:平假名(hiragana),片假名(katakana)和萬葉假名(kanji)。萬葉假名基於漢字的表意文字,而平假名和片假名是表音文字。其中,平假名最接近於英文字母,也有最多的圓形筆劃,其中大部分圓形筆劃都是順時針方向:

文字あ像英文字母a,是這樣書寫的:

日語和中文的文字都遵循嚴格的筆劃順序。整體來看,一個字是從左上到右下的方向書寫的。美國羅格斯( Rutgers)大學數學教授書法家黃一知這樣解釋道:如果你畫一條水平線再畫一條垂直線,就像數字7一樣,那麼日文和漢字的書寫規則就是把這兩條線當做一個筆劃,中間也沒有停頓。(可以自己從紙上嘗試一下)

因此我們的手會自然而然形成習慣去順時針動,就像漢字「了」代表著一個動作的完成。

基於中文的文字的書寫規則在小孩子剛剛拿起鉛筆的時候就深深印在他們腦子裡了,這也奠定了台灣和日本的人畫圓基於相同的書寫方式。

當然,限於當時谷歌在大陸的狀況,這款網頁遊戲沒有辦法搜集到大陸的信息,這一研究也沒有中國大陸的數據,但Quartz研究了過往的研究,發現調查結果也支持了這個發現。

在1985年對中國人畫圓方式的調查中發現,151位參與者中有72%的人順時針畫圓。研究者指出,這也許是因為在行書(中國書法的一種)中筆劃多為順時針。

有興趣的同學也可以坐等谷歌更新帶有大陸數據的數據集,然後繼續這個研究啦。

三角形繪畫方式的相似度在基於中文的語言中更加顯著。97%台灣地區的畫手和90%的日本人和韓國人都是逆時針畫三角形。對比來看,美國人一筆划出的三角形,只有一半多一點的比例是逆時針的。

基於漢字的筆劃順序規定對角線的格式,就像一個三角形,是先從右向左再從左向右的。從「人」這個字,就不難發現這種規律。

另外一組國家的例子也可以讓人們更好地理解畫圓方式的不同。阿聯酋,科威特,阿爾及利亞,約旦,沙烏地阿拉伯,以色列,伊拉克和埃及在下面畫圓方式的分布圖中聚集在一起,幾乎互相挨著(除了泰國和韓國在中間)。

阿拉伯文和希伯來文包含很多曲線,讀和寫都是從右向左的順序。在阿拉伯語中,文字的曲線跟隨著手的方向,通常是順時針,這也更好地控制字與字的間隔。

下面是字母「b」和「n」在阿拉伯語中的書寫方式:

如果對剩餘國家畫圓方式觀察更仔細一些,就可以發現其他的一些規律。舉個例子,韓語(朝鮮語)的書寫系統中有大量的圓形。1500個韓國人所畫的圓有72%是逆時針畫的。

你也許以為韓國會跟台灣和日本的結果相似,但韓語的書寫規則其實是與中文和日語恰恰相反的:圓形都是逆時針書寫的。這就直接導致韓國畫圓方式的結果更趨近於其他的那些國家。

在泰國的結果中,有64%的圓是逆時針的,而其文字書寫同樣也包含著大量的圓形筆劃。在42個輔音中,幾乎所有都是從一個小圓圈開始寫。開頭的這個圓圈可以順時針也可以逆時針,但逆時針的圓是順時針的兩倍多。

下面是發音「m」的泰文:

你也許會問另兩種充滿圓形的文字,緬甸語和喬治亞語的結果如何。

緬甸同日本和台灣結果相近,僅22%的圓形是逆時針的。這支持了我們所得出的結論,但由於樣本只有9個,我們不能這樣輕易下結論。相似的,喬治亞只有72個數據,所以不具代表性。

剩餘的50個國家傾向逆時針畫圓。這些國家幾乎所有都在使用運筆從左至右、且沒有過多圓形筆畫的拉丁字母。英語也有筆順,不過沒有那麼死板:可能是因為在孩提時期像大多數使用拉丁字母的國家畫圓那樣一遍一遍地逆時針寫「c」和「g」。

當然,儘管有許多證據表明文字能夠影響人們畫圖形的方式,但是這一理論也不能解釋一切。越南也像美國一樣使用拉丁字母,並且有95%的人逆時針畫圓,可是使用中文筆畫的香港也有82%的人逆時針畫圓。

另一種可能的解釋是有人是左利手。也許右利手自然地傾向於逆時針畫圓,除非書寫系統教他們反向(順時針畫圓)。來自Quick,Draw!的數據並沒有表明用戶是左利手還是右利手,慣用手的不同可能顯著地影響到他們畫圖的方式。儘管如此,不同國家的左利手並沒有太大的不同,這可能並不能解釋台灣地區、日本和其它國家之間的巨大區別。

那麼,究竟什麼才是正確的做法呢?

Quaritz在文章中也做出了分析,在20世紀70年代美國為兒童開發的一項名為「torque test」(「扭力測試」)的常見的心理學練習中,孩子們會得到一張紙,上面有這個。

為了幫助研究人員辨明孩子是左利手還是右利手,孩子們被告知要先後用兩隻手畫圓把X圈起來。如果孩子逆時針畫所有的圓(被認為是右利手的證據)則被認為是「非標準」。如果孩子順時針畫了一個圓(與左利手相關)都被認為是「標準」。

美國心理協會主席、扭矩測試的創造者Theodore Blau在1977年發表的論文中認為,順時針畫圓是學習與行為變異的標誌。他警告說,標準畫圓的孩子們,可能有得精神分裂症的危險。

心理學家們後來反駁了上述觀點,並且一些人特別關注文化和教育對兒童繪畫習慣的影響。在1997年的一項跨文化研究中調查了不同年齡段的,在美國生活的美國學生、在日本生活的日本學生和在美國生活的日本學生:62名日本一年級學生中,約有半數同學順時針畫圓;三分之一的學生逆時針畫圓;五分之一的學生兩種方式都用。

但是,幾乎全部的六年級學生都是順時針畫圓,這暗示著研究者們孩子寫字越多,他們順時針畫圓的變得更加明顯。相比之下,有64%的美國學生逆時針畫圓,這個比例在六年級學生中也只有些許變化。

但是,並不只有日本是這樣。在1973年的跨文化研究中調查了不同年齡段的美國和以色列兒童是如何畫圓的,結果表明,也有大量的兒童逆時針畫圓。

研究人員指出,對以色列來說結果正好相反,他們用到的最接近圓的字母「 」,是順時針寫的。隨著時間的推移,美國人在畫圓的方向上更趨一致,100%的成年受試者逆時針畫圓。在以色列,各個年齡段的受試者中有70%順時針畫圓。

這些研究表明,不僅文化和寫字方式(書法)塑造了人們繪製抽象形狀的方式,而且也表明這種趨勢隨著時間的推移越來越明顯。寫的越多,習慣越根深蒂固。出於同樣的研究目的,我們在全世界範圍內收集了90,000個圓,構造了一個規模更加龐大、數據更加一致的數據集用以支撐過去在小規模數據研究中得到的結果。

如果英語是你的第一語言,你可能已經忘記了小時候上學時,艱難地握著鉛筆,笨拙地按照要求的結構臨摹大小寫字母。在某些語言中,這些規則不是可以忘卻的記憶,而是書寫的首要條件。比如,在日本和中國,筆順是工整書寫的重要部分,甚至可以象徵著教育程度。

現代漢語筆順系統是從漢代盛行的隸書系統演變而來的。隸書書寫時間太長,而人們想要寫的更快,因此隸書演變成行書,一種半草書風格,最終演變成今天的筆畫。根據書法家黃的說法,使用軟毛筆書寫能夠了解更多的現代中文筆順規則。

日本人同中國人一樣講究筆順。在1958年,日本教育部制定了國家級的筆順準則,建立了統一的標準,避免出現混亂。(如今這些規則被放寬了。)

「我認為我運筆的方式很有效並且寫出的字很漂亮」,日本協會語言中心主任TomoyoKamimura說道。「一些成年人書寫筆畫順序完全錯誤,我們輕視他們那樣書寫,我們認為他們沒有接受教育。」

如今,美國的小孩逐步被傳授印刷體和手寫體的方法,這種方法叫做「快樂書寫」。該方法提倡使用「魔法C」,一種逆時針曲線,用在「c,g,q,o」等字母中。因此,美國的學校會鼓勵小孩子們逆時針畫圓,來幫助他們養成以後第一次書寫字母時所需的基本運動技巧。

什麼塑造了我們?

我們有無數種微妙的方式,不知不覺地將文化帶進我們的世界:繪畫的方式,手勢的意義以及模擬真實世界的聲音。而這是海量數據的核心樂趣所在。

為了測試我們的理論,我們請了一些母語使用日語、阿拉伯語、希伯來語、漢語、泰語和越南語的同事、朋友和家人來畫圓圈,雖然這樣感覺有點不太好。但他們仍然很高興的加入了,因為他們除了好奇到底自己是怎麼畫圓以外,他們也渴望了解一個嶄新的領域。

誠然,這世界上還有很多我們不懂的事情。於此同時,對繪製形狀的研究在心理學上好像已經過時了。除了一個例外,我們發現所有與文化相關的圖形繪製研究以及「扭矩測試」(「torque test」)都是在1997年之前的。

我們可以合理推斷一下,全世界的人越來越多通過打字來交流,然而儘管某一天書法的藝術會被遺忘,但到了那個時候,也許我們已經形成了一個全新的以鍵盤為主導的文化差異呢。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 點愉 的精彩文章:

Newzoo:Paypal是遊戲玩家付款首選 23%看好加密貨幣
《堡壘之夜》看C羅唱歌跳舞!別樣的世界盃慶典!

TAG:點愉 |