畫師們害怕了沒？AI竟然只靠描述就能自己繪畫啦！

最新 01-22

關於人工智慧的圖像識別應用，相信小夥伴兒已經接觸了許多，比如面部識別、情緒識別和視覺搜索等。作為科技業巨頭之一的微軟，在該領域同樣有過許多嘗試：在牛津項目(Project Oxford)中，AI能識別圖片中人物的情緒;在CaptionBot應用中，AI不僅能識別用戶上傳的圖片，還能給出一段有趣的描述。

如今，微軟在AI圖片研究方面更近一步，帶來了AI繪圖功能：你只需給出說明(比如文字描述)，AI就可以自動生成圖片。據悉，與之前考慮過的頂級技術相比，drawing bot帶來了三重改進。比如上圖就是AI根據「一隻擁有黃色身軀、黑色翅膀和短喙的小鳥(a bird with a yellow body, black wings and a short beak)」這一說明，繪製出來的小鳥。

AI繪圖背後的技術原理

據介紹，drawing bot基於生成對抗網路(GANs)技術，而且微軟研究人員更進一步，使用被稱為AttnGAN(Attentional Generative Adversarial Network)的技術，能將輸入的句子分成獨立的單詞，並與圖像的特定區域匹配起來。研究人員提到AttnGAN時表示，這是用算術替代了專註這一概念，「專註是人類的概念;我們通過數學讓專註可計算了!」

據悉，研究人員以數學演算法，為AI提供了注意力模型(The attention model)和DAMSM模型(Deep Attentional Multimodal Similarity Model)。其中，注意力模型擁有文字特徵和圖片特徵兩種輸入數據(input)。DAMSM則包括了text encoder、image encoder和基於attention model的attention-driven image-text matching score模塊，能學習映射圖像和單詞分區兩個神經網路的公共語義空間，以及以單詞層級測量圖像文本相似度，從而計算包括細密紋理的圖像生成。

想了解更多技術細節，請查看研究人員發布的論文：https://arxiv.org/abs/1711.10485v1

AI繪圖未來大有可為

據悉，該研究團隊最初藉助名為CaptionBot的AI系統來深入研究計算機視覺和自然語言處理問題(該系統可以自動為照片添加字幕);此後，研究團隊又創建了名為SeeingAI的AI系統，它的作用是幫助盲人群體認識世界(通過識別圖像給出地點、物體屬性等回答);然後，研究團隊想通過文字來生成圖像，「這意味著你需要AI的機器學習演算法能想像圖片中丟失的部分。」

有趣的是，得益於研究人員提供的訓練數據，drawing bot也擁有了一點基本常識和想像力，能填補圖像的一些細節。以小鳥為例，即使文本中並沒提到樹枝，drawing bot也經常會畫出一隻站在樹枝上的鳥，那是因為最初給它輸入的圖像大部分都是這樣的。

微軟研究員強調，該AI系統不是根據描述去尋找網路中對應的圖片，而是完全靠自己創作出來的，「AI畫出來的鳥可能並不存在於真實世界——這些鳥只不過是計算機想像力的結果而已!」據悉，該技術未來可扮演畫家設計師等的草圖助理，或是用於聲控照片細化工具。

隨著技術的進步，這項技術甚至還能在生成基於劇本的動畫電影，為動畫電影製作人提供助力。當然，目前該技術還存在瑕疵，不過微軟已經邁出了非常重要的一步。如果未來真的有根據文本描述繪畫的AI投入實用，你會有什麼感想呢?

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI天下 的精彩文章:

TAG:AI天下 |