DeepMind的AI已經可以根據句子「作畫」了
谷歌的DeepMind團隊一直致力於將最新的人工智慧技術帶給世界。儘管讓圍棋界震顫的AlphaGo已經宣布「退役」,但是DeepMind的人工智慧研髮腳步從未停止。
近日,他們又取得一項新成果:研究人員們創造出一種新的方法,使得他們的人工智慧可以依據人類輸入的句子來創造圖片。
在這個技術中,句子的內容越詳細,依此創造出的圖片就越細緻,這在AI圖片處理領域無疑是一個大突破。
圖丨將4*4的低解析度圖片轉化為256*256的高解析度的圖片
科幻電影《銀翼殺手》和《犯罪現場調查》這樣的影視作品中都曾出現過網路程序生成逼真圖片的場景。2017年2月,谷歌的英國籍科學家開發一種「強化」圖片的新方法,處理過的圖片和影視劇里呈現的效果已經非常接近。不過,當時的方法是藉助的是PixelCNN(像素卷積神經網路),機器通過效果優異的近似演算法成功將低解析度的圖片轉化為高解析度的圖片。
圖丨圖片強化過程
像素卷積神經網路在對自然圖片進行密度估計方面達到了最高水平。然而,儘管訓練是十分快速的,推斷卻耗費巨大,這是因為對每個像素點的估計,都需要一個神經網路;那麼對於對N個像素點,複雜度為O(N)。緩存的激活可以將這一過程加速,但仍然需要對每個像素逐個處理。
圖丨左上角是像素組1,右上角是像素組2,以此類推。為了清晰,只使用箭頭記號去標明及時臨近的依賴關係,但是注意分組中的所有像素都能被用於一個給定分組中的所有像素。比如說所有2組中的像素都會被用於預測組4中的像素
這一問題在這個新演算法中得到解決。並行的像素卷積神經網路通過將特定的像素組成有條件獨立的模型,可以更有效的進行推斷。新的像素卷積模型實現了有效的密度估計,並在速度方面實現了量級的提升——在用來測試的512 × 512的樣本圖片中複雜度達到O(log N)。
圖丨當輸入「一個年輕男人騎在棕色的馬的背上」時,AI可以從圖片集中識別出各部分信息對應的圖像,圖片下半部分為其識別出的「棕色的馬」
現在,這項技術被應用於將文本轉化成圖片,可以通過圖片集進行學習,分辯諸如鳥類、人臉等概念,並創造與所學圖片明顯不同的圖像。
而且,一個詳盡的提示能夠比沒有任何細節的提示獲得更為精準地輸出圖片。例如,如果你輸入「一隻有著黑色頭部、橙色眼睛和嘴巴的黃色小鳥」,人工智慧將會返回一張十分詳細的圖片。
※SpaceX周末「二連發」,成熟技術保障擴大太空競賽領先優勢
※谷歌聯手MIT,要將人類的多重感官賦予AI系統
※撥打9600多萬次詐騙電話的大騙子被罰了1.2億美元!
※SpaceX二手火箭發射再獲成功,48小時內將進行火箭發射
※YouTube發布 VR180,VR走向主流之前又一里程碑?
TAG:DeepTech深科技 |
※勵志句子:While there is life there is hope.
※英語口語天天練!實用口語句子匯總!What is your opinion?
※必讀英語唯美句子:Give time time 請給時間一點時間
※Nine Percent成員應援口號,網友:這麼肉麻的句子,大聲喊出來不臉紅嗎?
※基於 Doc2vec 訓練句子向量
※《朗讀者》中的經典句子你get到了嗎?
※適合七夕發的句子 get起來吧
※「QQ空間」置頂句子,每一條都「超炫酷」,再不用就out了!
※「點贊率超高」QQ置頂句子,句句少女心,網友:我out了
※才子寫下千古奇詞,通篇「AABB」型句子,讀完不能好好說話了
※誰語文好,讀讀這些句子!繞懵學霸很easy,老師也敗下風
※TOPIK閱讀句子太長頻遭考生吐槽?小技巧助你輕鬆破解
※這些句子,看懂的人都把它用在了個性簽名上........
※Top22條令人瞬間驚醒的句子,發人深思!(史上最全?深度)
※這些句子也太羞恥了吧,比SM還虐
※INS·傷感·壁紙:七分喪的句子,暗戀是個什麼滋味呢?
※120句外國經典作品的好句子:記住這一句,等於擁有了一部作品
※那些在冬日裡「暖到心」的句子,小仙女們,你們Get到了嗎?
※10年間,IU日記里的那些句子
※盤點那些愛情小說中用到爛的句子——TOP10