當前位置:
首頁 > 科技 > 為什麼谷歌的 AI 能創作有藝術感的音樂,卻講不好一個笑話?

為什麼谷歌的 AI 能創作有藝術感的音樂,卻講不好一個笑話?

為什麼谷歌的 AI 能創作有藝術感的音樂,卻講不好一個笑話?

用AI來創作鋼琴曲、繪畫貓圖,這些聽起來可能並不像是谷歌比較顯眼的項目,但對Douglas Eck來說,這是很有意義的。

Eck花了大約15年時間研究人工智慧和音樂,他現在是谷歌大腦團隊的一名研究科學家,領導Magenta——谷歌的開源研究項目,旨在通過機器學習來創作藝術和音樂。

他接受了TechnologyReview的採訪,講述了谷歌是如何用利用深層神經網路來創作音樂的,以及為什麼Magenta不能講好一個笑話。

使用人工智慧技術來創作藝術並不是什麼新鮮事,谷歌的做法有什麼獨特之處呢?

我們正在探索這個方向非常具體,主要與與深層神經網路和循環神經網路以及其他類型的機器學習有關。同時,我們也在努力讓有創意的程序員和開源開發者同時參與到這個社區中來,所以我們將其作為一個開源的項目。

很多Magenta項目都集中在音樂上。為什麼人工智慧對音樂的創作和發展有好處?

老實說,這只是我的偏好。我的整個研究生涯都圍繞著音樂和音頻。我認為Magenta的研究範圍一直都與藝術相關,無論是講故事,音樂,敘述,還是圖像。簡單一點來說,就是嘗試理解如何將AI當作創意工具使用。但你必須從一個具體的方向開始。我認為,如果能在像音樂這樣複雜的事情上取得了重大進展,對我們來說非常重要。那麼下一步就是能夠像音樂一樣,把其中的一些內容映射到其他領域。

我們能聽一些用Magenta做的音樂嗎?

這是一種名為「Performance RNN」的模型的音樂(https://magenta.tensorflow.org/performance-rnn)。

這是一段音樂作品,但同時也是一種音樂表演,因為這個模型不僅產生了四分音符,也會決定樂曲的播放速度、聲音大小。事實上,它還在複製訓練的內容,那是一些鋼琴比賽中表演的片段。

正如該作品所展示的那樣,Magenta製作的音樂基本上是即興演奏。那麼AI可以創作具有連貫音樂結構的音樂嗎?

我們正在努力解決這個問題。對我們而言,未來主要研究的方向之一就是讓機器學習模型來學習架構。這會在音樂中體現出來。你會聽到,沒有一個總體模型能決定事情的發展方向。

我們現在做的是想讓和弦、甚至和弦的符號發生變化,並學習如何利用這些和弦變化。最終的目標是開發出一種端到端模型,可以自行計算出所有層次的結構。

說一說Sketch-RNN(遞歸的神經網路)吧,聽說最近Magenta實驗中,就採用了這樣的技術來畫畫,可以跟你的你的草稿用多種風格進行繪畫。

我們可以獲取到人們在玩Pictionary時的一些數據來訓練人工智慧,這些數據都是來自於谷歌創意實驗室(Google Creative Lab)的AI繪畫實驗。

但這些數據是有限制的。你只能從這些20秒的小圖中得到一些相關的數據。不過,我覺得Sketch-RNN的負責人David Ha的工作做的挺漂亮。他訓練了一個周期性神經網路模型來學習如何復刻這些繪畫。他迫使模型學習什麼是重要的。這個模型不夠強大,不足以記住整幅畫。因為它無法記住它所看到的所有筆畫,所以它的工作就是復刻大量的貓或其他的東西。在整個過程中,它被迫學習數百萬張貓圖像中的共同特徵是什麼。所以當你玩這個模型的時候,你可以要求它憑空畫出新的關於貓的圖像。它會畫出來非常有趣的貓,不過,這看起來和人們畫的貓的樣子並不是很像。

為什麼谷歌的 AI 能創作有藝術感的音樂,卻講不好一個笑話?

我了解到你正在和Magenta一起教電腦講笑話。電腦會產生什麼樣的笑話?

這個項目才剛剛開始,非常具有探索性,而且也給機器提出了一個問題:它能理解笑話中的笑點嗎?尤其是那些與雙關語相關的笑話。人們很容易就能理解到其中的笑點,但在機器看來這就是一句普通的句子。而且,在我看來,我們能夠理解到其中的笑點,其實是一種「被迫」進行的關聯,只有理解了它本身的含義,才能「Get」到笑點。而且我認為,直覺上,這句話有一個幾何圖形。如果建築物倒塌在你的頭上,這是令人驚訝的;一句妙語並不會讓你感到驚訝。就像,哦,對了,我明白了!你知道嗎?我認為,這種「我得到它」的感覺是一種倒退,你必須要做才能得到它。所以我們研究了一些特殊的機器學習模型,它們可以產生這些所謂的真矢量,來理解句子中語義的變化,然後,我們就能獲得不同的效果嗎?

比如說這樣的一個笑話:「魔術師非常生氣,把她的「hare」都拉了出來。」這裡面有很多的雙關語,hare和hair,你懂的,對吧?(譯者註:笑話中的兔子用的單詞是「hare」,和「hair」頭髮構成了雙關。)

是啊。你必須要了解很多辭彙和語言才能理解它。

是的,你必須知道很多。這個模型不僅不會講笑話,也不會有趣,而且它所說的內容我們也無法理解。

你現在想要通過Magenta來研究什麼呢?解決什麼問題呢?

我們想要試著通過音樂讓人工智慧理解更多的長期結構,並嘗試去研究另一個有趣的問題:我們能從聽眾(受眾)、而不是從藝術家的反饋中學習嗎?

這也可以看做是一種藝術的迭代過程。甲殼蟲樂隊有12張專輯,每一張都不一樣。這些都在展示,他們正在從同伴和觀眾那裡得到反饋,同時也在學習其他藝術家的作品,然後創作了作品。所以,他們與我們的文化聯繫非常緊密。藝術家並不是靜態的。

這是一個非常簡單的想法:你能不能讓一個有創造力的模型從得到的反饋中學習呢?比如說「哦,那太好了」,或者是「太糟糕了。」我們想要達到的效果是,讓機器學習模型和藝術家一樣,通過不同方面的反饋進行學習。我們還可以通過強化學習來設置這些參數,我們也在研究這個問題。

當我在聽Magenta創作的音樂時,我在想:如果你可以使用數據來訓練人工智慧,那麼人工智慧可以原創嗎?還是只能根據訓練的數據進行再創作?

我認為這取決於我們怎麼去定義原創。機器學習演算法不太可能具有獨立性,併產生一些革命性的新方法來進行藝術創作。但是一個從事這項技術的人或許能夠做到這一點。何況,我們離人工智慧創造真實世界的那一天還有非常、非常、非常遠的距離。

就像這樣,離得那麼遠。與此同時,我認為人工智慧創作出來的很多藝術作品在另一種意義上都是原創的。就比如說,人工智慧創作出了一首很酷的EDM歌曲,並放到了合適的地方。作為舞會的背景音樂是非常有趣的,而且是全新的,也或許不是,但這創造一個全新的音樂類型。

而且在我看來,這種創造力無論如何都很有趣。總的來說,我們所做的大部分事情都是我們所理解的,我們也都在嘗試新事物。就這種創造力,我認為我們現在擁有的人工智慧可以發揮巨大的作用。它並沒有複製數據集,不是嗎?這是把事情搞混了。

原文鏈接:https://www.technologyreview.com/s/608777/why-googles-ai-can-write-beautiful-songs-but-still-cant-tell-a-joke/

(36氪編譯組出品,未經許可禁止轉載。編輯:郝鵬程)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 氪星情報局 的精彩文章:

iPhone都出到X了!你還記得那些年用過的翻蓋手機嗎?
小區都裝了智能快遞櫃,馬雲還喊你刷臉取件,但日後收費能行嗎?
人工智慧代替人?不,是增強人類
劉強東最正確的決定!進入這個油水多的行業,京東怕是要賺翻!
人工智慧如何影響未來?我們不會失業,但要經歷痛苦的調整期

TAG:氪星情報局 |