當前位置:
首頁 > 最新 > 藝術通過了藝術創作圖靈測試?

藝術通過了藝術創作圖靈測試?

一別三年,甚是想念。

公號找回不易,特此獻上一篇滾燙的譯文,叨擾了~

原論文首頁截圖

譯:丁丁

CAN:創新對抗性網路

GAN:生成對抗性網路

通過學習風格流派和從風格流派標準中偏離的方式進行藝術創作

我們提出一個新的藝術創作系統。系統通過觀看藝術作品和學習風格來產生新的藝術作品,並通過偏離所學習的風格來增加藝術覺醒潛力,從而使作品變得更有創造性。我們基於生成對抗網路建造,GAN已經顯示出學會通過模仿給定分布生成新穎圖像的能力。不過我們認為這個網路在產生創意作品方面能力有限,我們提出對其目標進行修改,使其能夠通過最大化偏離已建立的風格,並最大限度的減少偏離給定的藝術分布來進行創作。我們進行實驗來比較人們對於系統生成的藝術和藝術家創作的藝術的反應。結果表明人們並不能從那些展示在頂尖藝博會中的作品和那些當代藝術家們的作品中分辨出系統生成的作品。

1 簡介

自人工智慧初露端倪,科學家們就已經開始探索機器創新行為的可能性,例如詩歌、故事、玩笑(幽默)、音樂、繪畫等等,當然還有創新性地解決問題的方法。這個能力是證明人工智慧演算法的確是有智的基礎。

就視覺藝術而言,眾多系統領域諸如AI和計算創造力,還有電腦圖像和機器學習,都已經提出自動化創作藝術。包含計算創意文學在內,提出不同的演算法來關注探索創新領域的多樣且高效的方法。許多方法使用了一種演化進程,在這種進程中,演算法通過生成候選項進行迭代,用一個匹配度的參數來進行評估,然後通過修改使其在下一代提高匹配度得分。很顯然,這種進程是在遺傳演算法框架內進行的。正如Dipaola和Gabora 2009所指出的那樣,任何演算法的挑戰都在於「怎樣寫一個既合乎邏輯又具有審美的匹配度參數」。一些早期的系統利用人去循環地指導這個進程。在這些互動系統中,電腦負責探索出創新空間,人則扮演觀察者,觀測誰的反饋在根本地主導這些進程。近期的系統已經分析出了感知和認知在創意進程中的角色。

這篇論文的目的在於研究出一個用於生產藝術的計算機創造系統,這個系統排除在創作過程中人類藝術家的參與,取而代之的是學習過程中人類藝術作品的參與。在藝術創作演算法中最根本的組成部分,是把其創作過程跟藝術史中人類藝術家們創作出的藝術作品聯繫起來。我們相信這是重要的,因為人類的創作過程是建立在過去接觸藝術的經驗上的。一個人類藝術家被其他藝術家的作品所持續影響,而且已經體現在他/她廣泛而豐富的藝術形態中。其中最大的未知在於人類是如何將他們關於過去的藝術知識和創作新的藝術形式的能力整合起來的。怎樣整合「接觸藝術」和「創造藝術」這一理論需要被建立起來。

Colin Martindale (1943-2008) 提出一個基於心理學的理論,解釋了新的藝術創作。他假設在任何一個時間點,具有創作力的藝術家會儘力去提升其作品中的覺醒潛力去對抗常態。然而,這種增長必須被控制在最小程度內以免對觀察者造成負面影響(最小努力原則)。Martindale也假設當藝術家們在藝術風格定義中發揮出其他含義時,打破風格作為提升藝術覺醒潛力的一種方式得以出現。這篇文章的立意就建立在Martindale最小努力原則和他對風格突破的解釋上。在解釋藝術創作過程的眾多理論中,我們發現Martindale的理論在計算機領域是相對可行的。

在各種各樣的應用程序領域中,深度神經網路最近已經在改進人工智慧方面扮演著變革性的角色。特別地,許多迭代的深度神經網路被認為具有生成新穎圖像的能力來模仿給定的訓練分布,GAN在此目標中已表現得相當成功。我們質疑像這樣的網路在他們原先的設計中被限制了生產創意產品的能力。受到Martindale的理論的啟發,本文提議通過最大程度地偏離既定的藝術風格同時最小限度地從藝術分布中分離的方式修改GAN的意圖,使其能夠生產創意作品。

CAN生成的圖像示例。生成的圖像從簡單抽象到複雜紋理和組合形式都有。

2. 方法

2.1 背景

此觀點的提出受到了D.E Berlyne(1924-1976)的理論的激發。Berlyne認為心理學概念「覺醒」對研究審美現象有很大關聯性。「覺醒程度」衡量一個人有多麼警覺和興奮。覺醒程度從最低水平,當一個人處於睡眠或休息時,到最高水平,當他/她處於暴力的,憤怒的,或是充滿激情的情境中。在不同機制下的覺醒及其對藝術的重要性和關聯度是外部刺激類型的屬性。

「覺醒潛力」一詞指的是導致覺醒提升的刺激類型的屬性。排除刺激類型的其他心理學和社會生態學的屬性,Berlyne強調對於審美最重要的覺醒提升屬性是新鮮感,驚訝,複雜性,模糊(歧義)和困惑。他創造出「合併變數「一詞來統稱這些屬性。

新鮮感指的是刺激程度與觀測者之前所看到的和經歷過的程度不同。驚訝指的是刺激程度與預期程度不一致。驚訝與新鮮感不一定相關,例如它可以源於缺乏新鮮感。不同於依賴相似度和差異度的內部刺激對比而形成的新鮮感和驚訝度,複雜性是一種隨著刺激中獨立因素的增強而提升的內部刺激屬性。模糊指的是在刺激中語義和句法之間的對抗。困惑指的是由於多重的,潛在不一致的含義引起的模糊感。

很多研究表明人們偏愛帶有溫和覺醒潛力的刺激。刺激太小被認為無趣,刺激太大會激活厭惡系統導致消極反饋。Wundt曲線解釋了這個行為,即愉悅度與覺醒潛力之間的關聯。

Wundt曲線(無論何時通過稜鏡觀察似乎都是彎曲的直線,並且每當稜鏡被移除時,似乎在相反方向上拱起——威廉馮特,實驗心理學之父)它幫助解釋一個想法或產品的新鮮感。在模型中,X代表愉悅程度,正值代表積極享樂價值,負值代表消極享樂價值,Y代表覺醒潛力,從原始值到迭代更新。愉悅感隨著緊張和新奇的刺激逐步上升到一個頂點後開始大幅降低。

Berlyne也致力研究覺醒溫和機制。常態化(心理學辭彙,也作習慣化)在藝術中很重要,它涉及重複刺激的反饋中降低覺醒值。

Martindale強調在藝術創作系統中習慣化的重要性。如果藝術家持續創作相似的作品,會直接降低藝術的覺醒潛力和可取程度。因此,在任何時間段,藝術創作系統會儘力增強創作的覺醒潛力。換而言之,習慣化形成一個藝術變革的持續壓力。根據Wundt曲線的研究發現(「輕微的而非超常的刺激是首選「),這種增長必須控制在必要的最低數額以內,彌補尚未掉入消極享樂範疇的習慣化,Martindale把這個原則成為」最小努力「。因此,這裡有一種反作用力導致藝術變革加快進度。

2.2 藝術生產媒介劑

我們提出一個藝術創作媒介的模型,隨後提出一個利用GAN變種的功能性模型讓它具有創造力。這個媒介的目的是以一個受限的方式(避免觸發厭惡系統而落入消極享樂範疇)利用覺醒潛力水平的增長進行藝術創作。也就是說,這個媒介試圖生成的藝術作品是新奇的,但不能過於新奇。儘管在有無限可能性的創造領域找到一個達成的方法很難,但這在許多計算機創意系統中是很普及的。

在我們的模型中,藝術創作媒介擁有一種記憶,對已知藝術進行編碼,並且可以持續更新新的藝術內容。當生產的新藝術作品保持在可控的覺醒潛力增長過程中時,媒介直接地利用這種編碼記憶。在數種增長覺醒潛力的方式中,本文關注的是建立一種儘力提升文本歧義和脫離風格標準的媒介,同時,避免過度遠離藝術作品的公眾接受度。此媒介致力於探索創作空間,使其從已知藝術標準中分離從而生產新的藝術。

生成的藝術作品中預期有兩種類型的歧義;一種是被設計的,一種是固有的。幾乎所有的計算機生成藝術都可能是含糊的,因為不能生成清晰的外輪廓或者可供解釋的主體。正因如此,Heath et la認為可創作的機器需要具有知覺(視知覺)去創造出似是而非的創作。這種有限的知覺是造成內在歧義的原因。典型地,這種類型的歧義能讓人們立即分辨出這個作品是機器生成的而不是人類藝術家創作的。在20世紀發展起來的眾多藝術風格也許都缺乏具象性或者清晰的主體,但人類觀察者也不會猶疑它們是機器生成的藝術還是人類創造的藝術。

正因這種內部歧義,人們總會把計算機生成的作品當作幻覺般的存在。衛報這樣評價由谷歌深夢計劃創作出來的圖像「大多數看起來就像初級版曼荼羅,或者一種電子幻覺,也許會讓你想起泰倫斯馬克南(致力於研究植物致幻葯/宗教致幻劑/薩滿教/形而上學/鍊金術等的美國易學家,他的時間波歸零理論被認為是偽科學)書籍的封面」,抑或被評價為「暈眩的,慣用毒品的,詭異的」。這類消極反饋也許就解釋了覺醒過度的結果,也就是根據Wundt曲線導致的消極享樂。

另一種歧義是設計師有意為之的文本歧義。合理之處在於藝術家最終會從打破已建立的風格而探索出一種新的表現方式來增長他們的藝術作品中的覺醒潛力,正如Martinadale所說。Dipaola和Gabora也表明,「創造者們通常會在一個被構架的區域內工作,遵守那些他們最終會打破的規則」。

這個藝術生成媒介被一個稱為CAN的模型實現,下文中會介紹。這種網路被設計用來生成藝術作品,通過背離已建立的藝術進程或風格,而最大程度地混淆人類觀察者去分辨它究竟屬於哪一種風格。

2.3 GAN:好勝卻缺乏創造性

生成對抗性網路有兩個子網路,一個生成器和一個分辨器。分辨器進入到一套圖像(訓練圖像)中,試著分辨出「真」圖像(從訓練集中)和被生成器生成的「假」圖像。生成器在沒有見過訓練圖像集的情況下,儘力生成與這些圖像相似的圖像。生成器先是隨機生成一些圖像,然後接收分辨器關於真假的信號。在平衡中,分辨器應該不能分辨出生成器生成的圖像與訓練集中的實際圖像的區別,因此生成器成功生成了來自與訓練集相同分布的圖像。

現在讓我們提出一種假設,即在繪畫作品上訓練出一個GAN模型。自生成器被訓練來生成可以愚弄分辨器去相信這是來自訓練分布的圖像以來,生成器最終只能生成那些看起來像是已經(在藝術史中)存在了的作品。沒有動機去生成任何創造力。沒有動力去迫使生成器探索創意領域。讓我們思考一個可以作弊的發生器,而且已經從訓練數據中獲取樣本。在這種情況下,分辨器會立即被愚弄去相信生成器正在創造藝術,而事實上是已經存在的藝術作品,因此不是新奇和具有創意的。GAN擴展出以類別和標題作為生成條件。我們可以把GAN看作可以被設計和訓練成通過給予標籤來生成不同風格和類型的圖像。這就可能生成一些藝術作品看起來像,例如,文藝復興,印象主義或立體主義。這同樣沒有任何創意成分。當今沒有任何藝術家會為了模仿巴洛克或印象主義或任何傳統而創作,除非是帶有諷刺意味的。根據Berlyne和Martinadale的觀點,藝術家會通過創造新奇的,驚訝的,帶有歧義的,或者令人困惑的藝術來增長他們作品中的覺醒潛力。這些突出了使用GAN創作的基本局限性。

2.4 從好勝到創造

在CAN中,生成器被設計來接收兩個信號,這兩個信號源於分辨器中兩種互相矛盾的力量,從而達到以下3點:1)生成新穎的作品;2)不能太新穎,即不能離所分區域太遠,否則會生成太多覺醒因子,從而根據Wundt曲線激發厭惡系統,陷入消極享樂範疇;3)生成的作品應該提高藝術風格的模糊度。

與GAN相似,該網路有兩個子網路,一個分辨器和一個發生器。分辨器獲得大量帶著風格標籤的藝術作品(文藝復興,巴洛克,印象主義,表現主義等等),然後利用它來分辨風格。生成器無法獲得任何作品。它從一個隨機的輸入開始,但不像GAN,它為生成的任一作品從分辨器接收兩個信號。第一個信號是分辨器對於「是否是藝術」的劃分。在傳統的GAN中,這種信號能使生成器改變自身去生成圖像,使其更頻繁地接收分辨器去判斷圖像是否屬於同一分區。自從分辨器被用於訓練生成藝術作品,它將會表明分辨器是否認為生成的藝術作品是來自與其所知的實際藝術作品相同的分布。在這個意義上,這個信號表明分辨器是否認為所呈現的圖像是「藝術或不是藝術」。自從生成器只接受這種信號,它最終會彙集出高仿藝術作品。

第二個信號是生成器接收的一個信號,這個信號是關於分辨器如何很好地把生成的作品歸類到已建立的藝術風格中。如果生成器生成圖像,分辨器認為它們是藝術作品,並且能輕易地歸類到其中一個已建立的風格中,接著生成器就會愚弄分辨器去相信這就是存在於已知風格里的實際作品。相反,具有創造性的生成器會努力生成使分辨器困惑的藝術作品。一方面愚弄分辨器去認為它是藝術,另一方面使分辨器對其所屬風格感到困惑。

這兩個信號是互相矛盾的,因為第一個信號迫使生成器去生成能被分辨器接受為「藝術」的作品,如果它符合某個已建立的風格標準,分辨器就會把它歸到那一類。第二個信號會阻礙生成器這樣做。這是因為第二個信號迫使生成器去生成風格模糊的作品。因此,這兩個信號應該共同推動生成器去探索接近藝術風格分域的那部分創意空間(最大限度實現第一目標),同時在符合標準藝術風格的範圍內使生成作品的模糊性最大化。

CAN系統的導圖

3 技術細節

GAN網路是近幾年最成功的圖像分析模型。GAN通常通過兩個玩家間設置遊戲來訓練。第一個玩家,我們稱它生成器G,作為訓練數據(又稱 Pdata)從相同概率的分區生成樣本,而不直接獲得這樣的數據。另一個玩家,分辨器D,檢驗樣本是來自訓練數據(真的)還是相反(假的)。分辨器和生成器都是深度神經網路的模型。

4 結果和驗證

4.1 訓練模型

我們使用從WikiArt公眾資料庫中收集的繪畫作品來訓練網路。這份收集涵蓋從15世紀到20世紀的1119位藝術家的81449幅作品。表格1展示了在訓練中所用到的每種風格流派的具體數據。

表格1:訓練所用的藝術風格

來自三條基線的圖像。頂行:由藝術訓練DCGAN 64*64基線模型生成的圖像樣本(根據實驗I中人物外形相似度的等級排列前六個和後六個圖形)。中間行:由藝術訓練DCGAN 256*256基線模型生成的圖像樣本(根據實驗II中人物外形相似度的等級排列前六個和後六個圖形)。底行:由CAN模型風格分類生成的圖像樣本,帶有風格分類和不帶有風格模糊性的CAN變體。(loss?)圖像展示了諸如肖像畫,風景畫等易識別的類型。

4.2 定性驗證

評估由機器生成的人工作品的創造性是一個開放且困難的問題。正如Colton2008所注釋的那樣,一件人工作品的審美評估與普通的創造性評估是不同的。圖1,4.2和7展示了CAN模型生成的圖像。這些圖像看起來並不像傳統的藝術作品,就標準特徵而言(肖像畫,風景畫,宗教繪畫,靜物畫等)。我們也看不到任何可識別的形象。大多數都很抽象。這能簡單地解釋為仿造失敗嗎?或者是主觀上想要生成新奇的圖像?所有的都有創造性嗎?這些難題正是我們想要努力解答的。

我們把通過三個基線模型生成的圖像與通過CAN模型生成的圖像相對比,在定性和定量的差異間獲得靈感。所有模型都使用形同的藝術資料庫,如表格1所示。

前兩個基線是原始版本DCGAN模型的變種。自從GAN致力於仿造訓練分區,我們就應該期待建立在藝術數據上的訓練模型會致使生成的圖像能夠顯示可識別的外形,主題事件,藝術特徵,風格流派。第一個基線模型是原始的DGCAN模型。這種模型生成64*64解析度的圖像。儘管同樣簡歷在藝術數據上,這種模型還是仿造失敗。圖4頂行展示出生成圖像的樣本;上排6個和下排6個的排列順序依靠以下實驗1中的人物主題評估結果。

第二個基線模型是原始的DCGAN模型,增加了兩層的生成器將像素提高到256*256,即這時的生成器具有跟CAN模型相同精確的構造了。我們同樣用藝術作品訓練這個模型。生成的樣品展示了有意義的改進;我們能清晰地看到富有審美的構圖和色彩對比在最終的圖像里。不過,生成的圖像依舊沒有任何可識別的外形,主題事件或藝術風格。圖4中間組展示了生成的圖像樣本;上排6個和下排6個的排列順序依靠以下實驗II中的人物主題評估結果。

第三個模型是CAN模型的變形,帶有風格分類損耗(不帶有風格歧義損耗)。在這種模型中分辨器通過學習藝術分區去分辨藝術風格。生成器跟GAN具有完全相同的損耗,即只能通過模仿訓練分區的方式欺騙分辨器。換而言之,不同於第一個基線學習藝術本身(是藝術/不是藝術),這個模型也學習藝術風格分類。我們通過風格-分類-CAN來引用這個模型。模型生成的圖像顯示了在模仿藝術分區上十分重要的進步,在此意義上我們可以看到很多肖像,風景,建築,宗教等題材的幻象。這在前兩種基線上是看不到的。圖像4中最後一組展示了這些圖像,肖像,風景,建築元素,宗教題材等等。此基線顯示了不帶有風格歧義的CAN模型,可以通過學習風格劃分來更好地模仿藝術分區,儘管不具有創造性。(以下的實驗IV被設計來定量地驗證這個觀點)

4.3 定量驗證

我們通過人類實驗來評估所提出的模型的創造性。這些實驗的目的是測試人類是否能區別除哪些是人類藝術家創作的作品哪些是電腦系統生成的作品,同時也給予評價。難題在於我們應該使用哪些人類藝術家的作品來做比較。自從這項研究的目標被定為評估人工作品的創造性,這時我們就需要對比得出人類對於這些人工作品的反饋是新奇的和具有創造性的。如果我們把這些人工作品跟,例如印象派藝術,做比較,我們會測試系統對這類藝術作品的模仿能力,而不是創造能力。因此我們收集了兩組人類藝術家的作品,和以下四組機器生成的作品:

1.抽象表現主義組:一組25幅抽象表現主義大師在1945-2007年間的作品,他們中許多都出自著名的藝術家之手。這組作品曾用於對比人類和機器區分藝術家,兒童和動物創作的抽象藝術作品的能力。我們用這組作為基線。人類被期待能夠基於熟悉程度輕易地判斷這些是藝術家們創作的。我們特別地使用抽象印象主義是因為它們沒有易識別的形象或清晰的主題。具備清晰外形和主題也許會在與缺乏這些因素的機器生成的作品做對比的時候,直接偏向斷定這些是由人類藝術家創作的。

2.2016年巴塞爾藝術博覽會組:一組25幅在Art Basel 2016(作為全世界當代藝術風向標的藝術博覽會)上風格各異的作品。出現在Art Basel 2016上意味著這些作品稱得上是人類藝術創作的前沿,至少對於藝術行業內人士和藝術市場而言。在排除了那些具有清晰外形和明顯筆觸的作品後,我們隨機挑選了這組,如圖8。

3.DCGAN組:我們使用由藝術深度卷積GAN構造生成的兩組圖片,如4.2中基線模型所描述的那樣。(卷積指一種計算機運算方式,卷積神經網路Convolutional Neural Networks 屬於人工智慧研究領域,卷積網路是為識別二維形狀而特殊設計的一個感知認知器,它主要用來識別位移/縮放及其他形式扭曲不變形的二維圖形。)第一組含100幅64*64像素的圖像,第二組含76幅256*256像素的圖像。

圖5:CAN生成圖像排名示例。上組:根據人類測試結果相似度排名靠前的圖像。下組:排名靠後的圖像。

4.風格分類CAN組(sc-CAN):一組100張由變種模型生成,這種模型在辨別器中注入了風格分類,如4.2所解釋的那樣。我們主要運用這組圖像把附加風格歧義的影響和所提出的功能損耗做對比。

5.CAN組:一組125張又所提出的模型生成的圖片。

實驗I:

這個實驗的目標是測試系統生成藝術作品的能力,能使人類使用者無法從人類藝術家創作的頂級藝術作品中將其區分出來。我們用了四組圖像(抽象表現,巴塞爾藝博會,CAN和像素值64*64的DCGAN)。在實驗中,向每個測試者展示四組圖像中的抽取的一個圖像並且回答以下問題:

問題1:你認為這個作品是藝術家創作的還是電腦生成的?測試者必須二選一:藝術家或者計算機。

問題2:被測試者被要求表明對此作品的喜愛程度,從1檔(非常不喜歡)到5檔(非常喜歡)。

結論:18位 MTurk 被測試者(①原本意義上的Mechanical Turk,是中世紀的一件震動歐洲的發明。一位發明家號稱發明了一種具有人類智能的機器人,能夠跟人下國際象棋,並且真的帶著這個機器人橫掃歐洲的各位象棋大師,結果發現裡頭其實藏著一個土耳其象棋大師,於是這台機器就被稱為Mechanical Turk。 ②Mechanical Turk是一家Amazon旗下的公司,其主要產品就是Mechanical Turk 勞動力網路交易平台。可以僱傭任何人,做任何工作,通過Amazon Payment系統支付報酬。這些工作往往是簡單、易驗證的,因此可以面向最廣大的勞動力資源,以低價格,獲得很好的結果。這就是業界盛行的Crowd-sourcing,如同希望把人腦用作某種高性能CPU來處理一些計算機難以處理的問題,成為系統的一部分。正如其Logo所聲稱:Artificial Artificial Intelligence (人工的人工智慧)。)參與了這個實驗,每個圖像我們獲得了10種不同的反饋。成果總結如表2. 我們可以從這些測試結果中總結出以下幾個結論:1)正如預期,抽象表現主義組的作品被誤認為是人類藝術家創作的作品得到了更高的票數(85%)。2)CAN模型和GAN模型所生成的圖像被測試者認為是藝術家創作的作品的結果比(53%比35%)。被測試者對CAN模型生成的圖像的喜愛程度也比GAN高(3.2%比2.8%)我們進行了雙樣本的t-測試來確定這些實驗結果的統計顯著性,帶著測試者對來自同一分區的CAN和GAN模型的圖像的反饋的原始假設。t-測試用p值=1.99932e-15和9.3634e-0.6駁回了對於問題1和問題2的這種假設。這個測試表明差異在統計學上是顯著的。當然我們不能從這個結果中輕易得出結論認為CAN比GAN更具創造性。一個可以完美地仿造人類藝術作品,而不帶有創新性的系統在這項測試中得分更高。然而,我們可以排除這種可能性,因為CAN和GAN所生成的圖像都不是在複製人類藝術作品,正如4.2中所解釋的那樣。3)更有趣的是,相比巴塞爾藝博會組,被測試者把CAN模型生成的圖像看做人類藝術家作品的人數更多(53%比41%),當兩組合併時,CAN生成的圖像在喜愛程度上只比巴塞爾中藝術家的作品低9%(53%比62%)。圖7顯示了根據被測試者的反饋結果CAN圖像的最高排名。圖6是這兩個問題的散點圖,顯示了喜愛程度和被測試者認為它們是藝術家所為還是計算機所為之間微弱的關聯性。

4.4 實驗II:

為了確認實驗I的成果,我們設計了另一個實驗,即在被測試者被問及這是人為還是電腦所為這個問題之前先展示圖像以及一系列其他問題。我們假設,如果先問問題,那麼被測試者會有更高几率隨機回答,一系列其他問題的提出有助於延緩這種隨機性,使得反饋更具建設性。

這些問題基於2.1中所解釋的合併變數。

問題1:你喜歡這個作品嗎? 1-非常不喜歡,2-不喜歡,3-中立,4-喜歡,5-非常喜歡。

問題2:指出這個作品的新穎程度:1-非常不新穎,2-不那麼新穎,3-中立,4-有點新穎,5-非常新穎。

問題3:你認為這個作品是令人驚訝的嗎:1-非常不驚訝,2-不是很驚訝,3-中立,4-有點驚訝,5-非常令人驚訝。

問題4:指出這個作品的歧義程度。我發現這個作品:1-非常不含糊,2-不怎麼含糊,3-中立,4-有些含糊,5-非常含糊

問題5:指出這個作品的複雜程度。我發現這個作品:1-非常簡單,2-有點簡單,3-中立,4-有點複雜,5-非常複雜

問題6:你認為這個作品是人類藝術家所為還是計算機所做?

除了將GAN組替換為由DCGAN模型生成的輸出像素為256*256的新組,我們用了實驗I中的其他相同數據,得到了與CAN模型相同的結論。CAN和GAN組都被調整到512*512。所有藝術家組也都被重置為512*512。

結論:我們用亞馬遜MTurk進行了這個實驗,每個圖像我們接收了10個不同的反饋。表格3分析了實驗結果。通常關於問題1到2問題5,不同組得到的答案不會有很大差別。然而每組對於問題6的反饋則有著相當大的差異。結論顯示出CAN和GAN生成的圖像被認為是人類藝術家創作的作品的概率比(75% vs.65%)。這個差異相當重要(t-測試 p-值=1.0147e-05。這個結論與實驗I是一致的,儘管我們把GAN組更改為一個更高像素的版本。儘管相同的CAN圖像都被使用到實驗I和實驗II中,實驗II中的人類/計算機問題的反饋更高(75%vs 53%),證實了我們推遲這個問題的假設。抽象表現主義,CAN和巴塞爾藝博會組間的等級排列,關於被藝術家創作(問題6),也跟實驗I中問題1的答案一致。

實驗III:

這個實驗的目標是評價關於由CAN生成的圖像是否能被認為是藝術的這一方面。我們將CAN組與表現主義組和巴塞爾藝博會組進行對比。這個實驗跟Snapper的實驗有些相似,Snapper et al(in text-reference:等其他人)的實驗探究什麼樣的程度讓人類覺得這個藝術作品是有意為之的,是有視覺主觀建構,可交流的,以及有精神感染力的。在這個實驗中,受訪者將針會對所示圖像回答下列四個問題:

問題1:當我觀察這幅作品,我能看到藝術家的意圖性:它看上去是有意地組合的。

問題2:當我觀察這副作品,我能看到一個結構浮現。

問題3:交流:當我觀察這副作品,我能感覺到它在與我交流。

問題4:精神感染:當我觀察這副作品,我能感受到它是令人鼓舞的和高尚的。

每一個問題的答案從低到高劃分為1(非常反對)到5(非常同意)個檔。受訪者被要求在回答前觀察圖像至少5秒。21位受訪者參與了這項實驗,每個圖像得到了10位不同受訪者的反饋。

Snapper他們假設真正的藝術家的作品會比小孩兒和動物做的作品得分更高,事實上實驗也證實了他們的假設。

我們也假設人類藝術家的作品在這些等級劃分中的級別比系統生成的圖像更高。驚喜的是,結果證明我們的假設是不正確的。那些由系統生成的圖像比由真正的藝術家創作的作品的等級更高,不論是抽象表現主義組還是巴塞爾藝博會組。(詳見表格3)

更高得分真正代表什麼似乎還有待商榷,以及是否這種不同就代表著重大意義。無論如何,事實上受訪者認為機器生成的圖像被認為是有意的,視覺建構的,可交流的,有精神感染力的,其程度與人類藝術家創作的作品程度相似,這就預示著人們覺得這些(由機器生成的)圖像是藝術!圖7展示了由CAN生成的部分例子,以受訪者對每個問題的反饋為排列標準。

實驗IV:

這個實驗的目標是評估在CAN模型中添加的風格歧義損耗和風格分類損耗的對比,在新穎度和審美吸引力上的影響。換句話說,是學習風格還是偏離風格,會導致被認為是更具創造性的結果。為了評估創造性,我們採用了人工智慧被認為是新穎的和影響力的創造力的最常見定義。鑒於影響力在此不甚恰當,我們使用新穎度來代替創造力。在這個實驗中,為了評估新穎度,我們使用了大量藝術史學專業的學生作為精通藝術教育的受訪主體,他們比普通的MTurk受訪主體更能夠評價新穎和審美。每個受訪者觀察一組兩幅被隨機挑選和擺放的圖像,一個來自CAN組,一個來自sc-CAN模型,然後回答下列兩個問題:

問題1:哪幅作品更新穎?

問題2:哪副作品更有審美吸引力?

結論:該實驗結論顯示59.47%的受訪者認為CAN組的圖像更新穎,60%認為CAN圖像更具審美吸引。這表明了CAN生成圖像過程中的風格歧義丟失與風格分類損耗相比的影響力。

5 討論與結論

我們提出了一種具有創造性特徵的藝術生成系統。我們證實了這個系統的認知,它基於一個新穎的創新對抗性網路。這個系統通過運用大量的15到20世紀帶有明顯風格標籤的藝術作品作為訓練方式。這個系統能通過優化尺度生成藝術作品,這種優化指的是在尊重藝術分區範圍內實現風格歧義的最大化。人類受訪者關於這個系統的相關實驗顯示人們時常混淆計算機生成的圖像和人類藝術家創作的作品,有時還給予計算機生成的作品更高的等級排序。

圖像7:實驗I和II中來自CAN模型的圖像排序

圖像8:巴塞爾藝博會組:從巴塞爾2017挑選出的25件作品。藝術家和年代依次是:Richard Caldicott 2003, Jigger Cruz 2016, Leonardo Drew2015, Cenk Akaltun 2015, Lang Li 2014, Xuerui Zhang 2015, David Smith 1956,Kelu Ma 1989, 謝南星 2013, Panos Tsagaris 2015, Heimo Zobernig 2014, 趙無極 1958, Andy Warhol 1985, David Smith 1956, Wei Ligang 2014, KONGChun Hei 2016, 葉永青 2015, Wei Ligang 2010, 潘小容 2015, Xuerui Zhang 2016, Xiaorong Pan 2015, Xiaorong Pan 2015, XuZhenbang 2015, Xuerui Zhang 2016, 趙無極 1963.

這個系統具有什麼樣的創造性特徵呢?Colton 2008認為一個有創造力的系統應該有以下三點標準:生成新穎的人工智慧(觀點),生成有質量的人工製品(技能),以及能分析評估自己的創意。我們提出的這個系統能夠生成新穎人工作品,是因為兩種信號的互相作用,這兩種信號源於生成過程,此過程被設計來迫使系統去探索創意領域而發現從已建立的藝術風格中分離的方式,同時足夠靠近藝術邊界使其能夠被判斷為藝術。這種互相作用也提供了一種系統自評的方式。這些人工作品的質量通過一系列人類實驗來證實,實驗證明人們不僅認為這些人工製品是人類藝術家創作出來的,而且在一些等級排列上給予它們更靠前的位置。

這個系統主要特徵之一是它在生成作品的過程中學習了藝術史。儘管它並不理解風格背後的概念。它對主題事件,明確的基本元素的樣式,和藝術規律一概不知。這裡的學習指的是藝術作品和風格的概念邊界。在這種意義上,系統能夠持續從新的藝術中學習,然後根據所學調整自身的生成過程。

為什麼人類受訪者對於CAN作品的反饋比巴塞爾藝博會樣品的反饋要好,我們不得而知。是他們有典型的風格認知偏見?偏見是由於他們的審美評價?是否意味著結論沒有那麼地有創造性?我們需要更多的實驗來幫助回答這些問題。

參考文獻:

[1] Ellie Baker and Margo I Seltzer. Evolving line drawings. 1993.

[2] Daniel E Berlyne. Arousal and reinforcement. InNebraskasymposium on motivation. University

of Nebraska Press, 1967.

[3] Daniel E Berlyne.Aesthetics and psychobiology, volume 336. JSTOR, 1971.

[4] Simon Colton. Creativity versus the perception of creativity incomputational systems. In

AAAI spring symposium: creative intelligent systems, volume 8, 2008.

[5] Simon Colton, Jakob Halskov, Dan Ventura, Ian Gouldstone, MichaelCook, and Blanca

Perez-Ferrer. The painting fool sees! new projects with the automatedpainter. InProceedings

of the 6th International Conference on Computational Creativity, pages 189–196, 2015.

[6] Steve DiPaola and Liane Gabora. Incorporating characteristics of humancreativity into an

evolutionary art algorithm.Genetic Programming and Evolvable Machines, 10(2):97–110,

2009.

[7] Ahmed Elgammal and Babak Saleh. Quantifying creativity in artnetworks. InProceedings

of the 6th International Conference on Computational Creativity, 2015.

[8] Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, DavidWarde-Farley, Sherjil

Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial nets. InAdvances in

neural information processing systems, pages 2672–2680, 2014.

[9] Jeanine Graf and Wolfgang Banzhaf. Interactive evolution of images. InEvolutionaryProgramming,

pages 53–65, 1995.

[10] Derrall Heath and Dan Ventura. Before a computer can draw, it mustfirst learn to see. In

Proceedings of the 7th International Conference on ComputationalCreativity, 2016.

21

[11] Sergey Ioffe and Christian Szegedy. Batch normalization: Acceleratingdeep network training

by reducing internal covariate shift.arXiv preprint arXiv:1502.03167, 2015.

[12] Justin Johnson, Alexandre Alahi, and Li Fei-Fei. Perceptual lossesfor real-time style transfer

and super-resolution. InEuropean Conference on Computer Vision, pages 694–711. Springer,

2016.

[13] Andrew L Maas, Awni Y Hannun, and Andrew Y Ng. Rectifiernonlinearities improve neural

network acoustic models. InProc. ICML, volume 30, 2013.

[14] Penousal Machado, Juan Romero, and Bill Manaris. An iterativeapproach to stylistic change

in evolutionary art.

[15] Colin Martindale.The clockwork muse: The predictability of artisticchange.Basic Books,

1990.

[16] Alexander Mordvintsev, Christopher Olah, and Mike Tyka. Inceptionism:Going deeper into

neural networks.Google Research Blog. Retrieved June, 20:14, 2015.

[17] Elliot Samuel Paul and Scott Barry Kaufman. Introducing thephilosophy of creativity. In

The Philosophy of Creativity: New Essays. Oxford University Press, 2014.

[18] Alec Radford, Luke Metz, and Soumith Chintala. Unsupervisedrepresentation learning with

deep convolutional generative adversarial networks. InInternationalConference on Learning

Representation, 2016.

[19] Scott Reed, Zeynep Akata, Xinchen Yan, Lajanugen Logeswaran, BerntSchiele, and Honglak

Lee. Generative adversarial text-to-image synthesis. InProceedingsof The 33rd International

Conference on Machine Learning, 2016.

[20] Theodore Christian Schneirla. An evolutionary and developmentaltheory of biphasic processes

underlying approach and withdrawal. 1959.

[21] Lior Shamir, Jenny Nissel, and Ellen Winner. Distinguishing betweenabstract art by artists

vs. children and animals: Comparison between human and machine perception.ACMTransactions

on Applied Perception (TAP), 13(3):17, 2016.

[22] Karl Sims.Artificial evolution for computer graphics, volume 25. ACM, 1991.

[23] Leslie Snapper, Cansu Oranc?, Angelina Hawley-Dolan, Jenny Nissel,and EllenWinner. Your

kid could not have done that: Even untutored observers can discernintentionality and structure

in abstract expressionist art.Cognition, 137:154–165, 2015.

[24] Wilhelm Max Wundt.Grundz¨uge de physiologischen Psychologie, volume 1. W. Engelman,

1874.

[25] Bing Xu, NaiyanWang, Tianqi Chen, and Mu Li. Empirical evaluation ofrectified activations

in convolutional network.arXiv preprint arXiv:1505.00853, 2015.

純興趣翻譯,歡迎指正!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

豐田與優步在自動駕駛技術談判
最有可能捧起奧布萊恩杯五支球隊

TAG:全球大搜羅 |