當前位置:
首頁 > 科技 > 三星新開發的AI模型 是如何讓蒙娜麗莎開口說話的

三星新開發的AI模型 是如何讓蒙娜麗莎開口說話的

近日,三星開發了一個新的AI模型,該模型能夠在不需要使用3D建模的前提下,來將靜止的圖像轉換為對話狀態下的視頻,其具體表現效果如下。

這種衝擊,猶如哈利波特第一次看到學校石牆上的肖像開口說話一樣。藉助這一技術,未來你不僅將會看到蒙娜麗莎開口說話,甚至還能看到愛因斯坦打哈欠。

而在蒙娜麗莎這一案例中,僅使用了三個不同的視頻便完成了動畫上的製作,效果正如看到的一樣,在面部結構和行為方面產生了截然不同的效果。

這一技術的實現,核心之一在於那個擁有超過7000個名人圖像、百萬張戶外拍攝的面部軌跡、以及2000小時的對話音頻和視頻記錄所組成的資料庫VoxCeleb。

藉助卷積神經網路CNN的特性,通過特徵檢測層對VoxCeleb中的數據進行學習,處理圖像堆棧並識別圖像中的內容。之後通過生成對抗網路,對人臉五官特徵進行辨識,來過濾創建的各種模型,最終將符合的模型應用於視頻之上。

目前,卷積神經網路這一技術,已經被廣泛用於網路上的圖像搜索和自動駕駛技術方面,未來當演算法改進或訓練模型變得更有效時,生成的效果也將更為逼真。

從好的方面來說,藉助這一技術,你可以讓自己的愛人或是影星永遠停留在你印象中的那個時期,或是將自己的虛擬形象放到各類應用當中。總之這是一個很具潛力的技術,而隨著AI技術的不斷突破,未來生成的效果、成本以及時間都將會大幅提升。

同樣令人擔心的是,該技術能夠僅憑一張圖片便可讓照片「活起來」,這也引起了一些技術專家和評論員擔心,未來該技術將如何發展,還值得商榷。不過目前,這一技術僅用於臉部和上半身,還無法做到讓蒙娜麗莎抬起雙手或是跳舞等行為。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 天極網 的精彩文章:

英特爾發布第十代酷睿:10nm時代來臨 新Logo同步亮相
未來新iPhone大變動:砍掉3D Touch 用新技術代替

TAG:天極網 |