三星新開發的AI模型是如何讓蒙娜麗莎開口說話的

科技 05-29

近日，三星開發了一個新的AI模型，該模型能夠在不需要使用3D建模的前提下，來將靜止的圖像轉換為對話狀態下的視頻，其具體表現效果如下。

這種衝擊，猶如哈利波特第一次看到學校石牆上的肖像開口說話一樣。藉助這一技術，未來你不僅將會看到蒙娜麗莎開口說話，甚至還能看到愛因斯坦打哈欠。

而在蒙娜麗莎這一案例中，僅使用了三個不同的視頻便完成了動畫上的製作，效果正如看到的一樣，在面部結構和行為方面產生了截然不同的效果。

這一技術的實現，核心之一在於那個擁有超過7000個名人圖像、百萬張戶外拍攝的面部軌跡、以及2000小時的對話音頻和視頻記錄所組成的資料庫VoxCeleb。

藉助卷積神經網路CNN的特性，通過特徵檢測層對VoxCeleb中的數據進行學習，處理圖像堆棧並識別圖像中的內容。之後通過生成對抗網路，對人臉五官特徵進行辨識，來過濾創建的各種模型，最終將符合的模型應用於視頻之上。

目前，卷積神經網路這一技術，已經被廣泛用於網路上的圖像搜索和自動駕駛技術方面，未來當演算法改進或訓練模型變得更有效時，生成的效果也將更為逼真。

從好的方面來說，藉助這一技術，你可以讓自己的愛人或是影星永遠停留在你印象中的那個時期，或是將自己的虛擬形象放到各類應用當中。總之這是一個很具潛力的技術，而隨著AI技術的不斷突破，未來生成的效果、成本以及時間都將會大幅提升。

同樣令人擔心的是，該技術能夠僅憑一張圖片便可讓照片「活起來」，這也引起了一些技術專家和評論員擔心，未來該技術將如何發展，還值得商榷。不過目前，這一技術僅用於臉部和上半身，還無法做到讓蒙娜麗莎抬起雙手或是跳舞等行為。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 天極網 的精彩文章:

三星新開發的AI模型 是如何讓蒙娜麗莎開口說話的