NVIDIA成功研發出可生成逼真肖像照片的AI
NVIDIA的研究人員最近公布了一項人工智慧與影像生成直接相關的研究成果,並在所刊發的論文中詳細介紹了該人工智慧技術是如何通過大量採集樣本,隨意生成各種與真實人物圖像無法區分的逼真人物肖像影像的。該技術是一個圍繞生成對抗網路(GAN)的替代生成器架構,該架構利用樣式轉移來產生最終結果。
新開發的GAN替代架構可通過3個風格控制生成一個逼真的人物肖像照片。
事實上,NVIDIA近兩年來一直在針對GAN架構進行研究,並在「計算機生成影像「上獲得了不小的進步,其生成的人物影像也越來越自然、逼真,但研究人員也承認,GAN架構引擎在對圖像合成過程的各個方面的理解,例如隨機的源合成功能方面,仍然有不少缺陷。而這次新開發的GAN替代架構,在很大程度上解決了這個源影像識別合成的問題,使得GAN能夠根據真實主題的照片生成全新的計算機合成圖像。
研究人員表示,這個新開發的GAN替代生成器架構已經學會區分圖像中的各種單獨元素。利用相對固定的樣式調整,對這些採集至各種原始圖像的源數據中的單獨影像元素進行控制,並最終合成在一張照片中,將元素全部展現出來。研究團隊為了讓此技術更容易理解和控制,使該人工智慧引擎會將圖像視為「風格」的集合,並且使每種風格都可以按以特定的比例進行控制,最終生成一個獨特而完全不同的人物肖像效果。
該人工智慧引擎會將圖像元素分為三種樣式類別:「粗糙」、「中性」和「精細」。在肖像方面,這些類別包括面部特徵、頭髮、膚色、眼睛、臉部形狀等元素。該系統還能夠針對細節,包括發質、曲卷程度和髮型等元素進行控制。
該人工智慧技術還可對非人物肖像的各種物體元素進行精細化控制。
該人工智慧引擎還可以對非人物肖像類的影像進行識別和生成,如毛毯上的圖案變化,貓的毛色斑紋、汽車噴漆顏色、主體以外的背景畫面等多種元素進行單獨控制和合成。
綜合所有這些改進,採用此人工智慧引擎的GAN替代生成器架構可以為傳統的GAN生成器提供相當優秀的合成影像,生成的照片質量和逼真程度遠遠超過了研究人員的預期。
NVIDIA的研究人員表示,此技術已經大大提升了GAN生成器的人工智慧引擎性能,相關技術也會在它的帶動下獲得突飛猛進的迅速發展。如此逼真的照片生成效果,從小的方面說可以使智能手機的拍攝質量更逼真(如背景虛化效果等),又或者是增加其拍攝效果的趣味性(如隨意更換各種背景,添加主體等)。從大的方面來說,該技術還能讓企業「按需生成影像」,如直接選擇各種需要的「元素」直接生成一張逼真的廣告圖片或者是包裝外觀設計等。又或者是,將該技術直接應用於各種影視製作和圖片後期修改領域,利用人工智慧的高運算能力和高數據處理能力,大大提高這些領域的軟體智能化。
文章刊發於《中國攝影報》·2019年·第3期·6版
圖文:吳申
編輯:唐瑜
聲明:本文內容如需轉載,請聯繫作者取得授權
給我好看
你就好看~


※2018年報友紅圖榜最後一彈 12月優勝作品公布!
※為什麼2萬元也值得買?華碩PA32UC專業顯示器試用體驗
TAG:中國攝影報 |