微軟小冰學會畫畫了，還要辦個人畫展，但離人類的創作水平依然有點遠

科技 05-17

人工智慧「小冰」創作的原創畫作被當成了Bing的首頁圖

繼寫作、唱歌后，微軟人工智慧「小冰」又實現了原創繪畫的能力。

5月16日，微軟正式對外發布人工智慧小冰的繪畫模型。該模型通過對過往四百年藝術史上236位人類畫家畫作的學習，獨立完成100%原創的繪畫作品，接近專業人類畫家水準。

作為Bing中國及日本、微軟小冰全球產品線負責人，微軟（亞洲）互聯網工程院副院長李笛及他的團隊設計了一個巧妙地聯動——用人工智慧微軟小冰的一副原創畫作，當做了今天Bing中國的封面圖。李笛表示，不同於簡單的複製、調色、隨機生成，微軟小冰的繪畫能力是基於文本或其他創作源激發，由人工智慧100%原創的繪畫作品。

值得一提的是，今年微軟小冰以「夏語冰」的化名通過了畢業考試成為了中央美術學院的碩士畢業生，並且在中央美術學院2019屆研究生畢業作品展上首次展出。同時，小冰的首次個人作品展將於6月舉行。

與詩歌一樣，「小冰」的繪畫能力也會通過小程序運營推廣給大眾，「少女畫家小冰」繪畫創作小程序將在一周後（5月22日）上線。

幾年前阿爾法狗戰勝了人類九段棋手李世石，「人工智慧究竟有多像人類」、「人工智慧會替代人類嗎？」、「人工智慧究竟能做到哪一步」等等爭論就從未停歇。而讓人工智慧創作，似乎又是一個充滿爭議的方向。

談到為什麼要讓人工智慧進行創作，李笛表示，目前世界上大多數人工智慧的開發都是圍繞著任務驅動型、知識型的路線來架構。但近些年，各大科技公司開始越發注重對人工智慧EQ（情商）的開發，不僅僅是微軟，亞馬遜開始希望Alexa能夠有同理心。百度也提出「智能體」這個概念，要求人工智慧更加有個性，更加有人設。人工智慧的構建已經從單純的IQ開始向IQ EQ演變。（詳見鈦媒體前文：第六代小冰上線了，微軟為什麼要花四年時間探索情感 AI？）

「我們希望人工智慧創造的目的，不是取勝，而是面向高度定製化的時代的內容供需關係。提供更快、更穩定、高並發的創作能力。」

會唱會寫會畫的小冰，離人類創作水平還有點遠

小冰目前會唱歌（語音）、會寫作（文本），而今天新發布的模型則賦予了小冰繪畫（視覺）的能力。

以鈦媒體現場來看，目前小冰的唱歌能力是最強的。現場也公開小冰演唱模型的第五個版本。除了能讓小冰像人一樣「換氣延長」外，新模型還改善了歌聲唱腔轉換的自然度，並首次公布了戲腔訓練成果。而李笛也透露，比起友商來說，小冰平均舒適時長、也就是聽眾能夠接受的最大連續播放時長是最高的。小冰的ACD（有聲讀物·平均舒適時長能夠達到21.5分鐘，而友商基本在五分鐘以下。

而在文學創作上，小冰的詩集也在一定程度上引起了爭議（詳見鈦媒體文章：人工智慧寫作的天花板在哪裡？），而對於更加依賴主觀的「繪畫」，很難用畫的「好不好」來評價這些作品，但毋庸置疑，人工智慧做原創輸出已經非常不容易了。微軟亞洲互聯網工程院為對該項目的研發已經整整持續了22個月。

對於爭議，微軟（亞洲）互聯網工程院人工智慧創造及商業事業部總經理徐元春現場呼籲，不要帶著「有色眼鏡」去看人工智慧創作。「人類一旦戴上這種有色眼鏡之後，他所提供的反饋就都是錯誤的，有可能會把我們引向另外一個極端。」

拋開大量技術細節，小冰繪畫模型有兩大特點：特點一：會大量使用誘發源，不是讓機器把一種已有的視覺元素轉成另外一種風格重新生成，而是要求在誘發源的幫助下，激發人工智慧進行重新的創作，這是這個模型最顯著的特點。特點二：機器在這個過程中會對人類社會最頂尖的藝術創作進行大量的學習。

但在鈦媒體來看，小冰的創作仍然距離人類創作還有點遠。在命題創作上，乍一看，上述畫作是頗具「藝術色彩」的，但如果仔細理解「中國的城市化進程」這個命題，小冰所畫的內容基本上都在「建築」、「人」、「傢具」這幾個模稜兩可的元素上來回重複，有點類似「xx星座就是這樣的」巴納姆效應。

小冰以（左圖）「自由」和（右圖）「束縛」為創作源所做的畫作

小冰以「中國的城市化進程」為命題，仿照人類畫家的風格進行的命題創作。

與詩歌一樣，「小冰」的繪畫能力也會通過小程序運營推廣給大眾，將在一周後（5月22日）上線面向大眾的繪畫創作小程序。在小程序中輸入創作詞語，小冰就會開始沿著以下程序進行繪畫原創，這比小冰寫詩的過程要複雜得多。

但現場開放的小程序版本並不能像上述DEMO中那樣完全理解命題。當鈦媒體編輯把「中國的城市化進程」這個命題輸入到測試版的小冰繪畫小程序里，小冰甚至回答「這些內容不好發揮，再換一個吧」。

而即便是輸入「城市」這個詞語，可以看到，小程序中的小冰依舊會把城市跟椅子、時鐘這類的元素聯繫到一起，畫作也不算完整，甚至有些過於抽象。

「小冰」們的商業價值體現：需要簡單創作能力、重複性強而又人才稀缺的崗位

不過，值得思考的一件事情是，類似小冰這種「情商」比較高的人工智慧們的商業化價值在哪兒？李笛表示，在文本創作、語音創作和繪畫創作上，小冰團隊都已經尋找到明確的產業化落地場景。目前微軟小冰在各內容生成領域的進展如下：

文本創作，目前主要覆蓋詩歌、金融摘要及研報等兩個領域。

語音創作，目前主要覆蓋音樂、有聲讀物和電台電視台節目內容等三個領域。

視覺創作，目前主要覆蓋繪畫及紡織服裝面料設計等兩個領域。

一方面，情商高的人工智慧被塑造成IP，以虛擬歌手、虛擬作家、虛擬畫家的身份被運營。但如果說歌手、主持人、畫家都無法帶來「普通」的規模性收益，「小冰」們更多的商業價值是體現在需要簡單創作能力、重複性強而又人才稀缺的崗位。

在小冰擅長的語音方面，除了大家比較熟悉的虛擬主播工作外，小冰更大的潛力是在有聲讀物上，「在國內的少兒有聲讀物這個領域，是處於供不應求的狀態。」

在文本輸出上，小冰更多的價值體現在高效地提供格式、內容規範的文本創作上。人類編輯相比，小冰輸出速度極快，可以穩定地提供20秒級的輸出，即一旦得到一個數據，20秒之後就可以完成摘要和研報的生成。小冰已與萬得資訊、華爾街見聞等機構達成了長期合作。

而繪畫能力的商業價值，還體現在原創、版權上。

正如發布會現場，徐元春對Bing封面圖的打趣一樣，「這樣圖我們完全擁有版權，不用再付一遍版權費了」，穩定的、高質量的、完整擁有版權的、可大規模創作的能力，是人工智慧繪畫設計能力能夠大規模被商業化應用的基礎。

目前，小冰的繪畫能力所瞄準的落地場景是服裝面料設計，去為稀缺的一線原創圖樣設計師進行補位。

據鈦媒體現場了解，以微軟小冰人工智慧框架為基礎，微軟已經中國紡織工業聯合會以及幾家最大的紡織面料企業聯合開發了人工智慧紡織服裝面料設計平台。在這個平台上，支持幾十種目前非常流行的紋樣和插話的設計，不重複的多樣性可以做達到10的26次方。「地球上所有沙子的數量是10的23次方，所以理論來講，這一套系統可以為地球上的每一粒沙子繪製一個完全不同的表面。」

（本文首發鈦媒體，作者/趙宇航）

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 鈦媒體APP 的精彩文章:

※周鴻禕：人臉識別也有缺陷，會被一種奇怪條紋「屏蔽掉」
※超速行駛的基因編輯，終於有了「剎車」裝置

TAG:鈦媒體APP |