偽造視頻連口型都能對上:「語音對口型」AI出世
北京時間7月13日早間消息,研究人員開發了一種機器學習演算法,可以將聲音片段變成能口型一致的視頻內容。研究人員展示的這段視頻顯示了美國前總統巴拉克·奧巴馬(Barack Obama)談論恐怖主義等多個話題的場景,但這實際上卻是使用現有的視頻演講人工生成的片段。來自華盛頓大學的研究人員相信,該系統可以最終用於改進視頻通話,甚至確定某段視頻的真偽。
該系統對神經網路進行訓練,使之學會觀看人類講話的視頻,然後將音頻文件轉化成真實的口型。之後再將其嫁接到視頻中的人臉上。為了實現這一目標,他們將該校圖形實驗室之前的研究成果,與最新的口型合成技術結合起來。
該技術還可以實現小幅時移,從而讓神經網路預測說話者接下來所要表達的內容。該團隊之所以選擇奧巴馬,是因為這套系統需要14小時的視頻進行學習,而作為全世界上鏡率最高的人之一,奧巴馬顯然是最佳人選。
「Skype或Messenger這樣的視頻聊天工具未來可以讓任何人收集視頻,然後對電腦進行訓練。」華盛頓大學的伊拉·開梅爾馬切-什利澤曼(Ira Kemelmacher-Shlizerman)說。
由於通過互聯網傳輸音頻所需的帶寬遠低於視頻,所以這套新系統或許可以終結故障頻頻的視頻聊天。
「當你使用Skype或Google Hangouts聊天時,會發現連接不太順暢,解析度也很低,這令人很不高興,但音頻往往很好。」該論文的聯合作者、艾倫學院教授史蒂夫·賽茨(Steve Seitz)說,「所以,如果可以使用音頻生成更高質量的視頻,那就太好了。」
之前的音頻轉視頻技術重點是錄製多個人反覆說同一句話的視頻,然後嘗試捕捉聲音與不同口型之間的相關性。但這一過程成本高昂,而且非常耗時。
通過將這一過程調轉過來——將視頻提供給網路,而不僅僅是音頻——該團隊可能開發各種演算法來判斷一段視頻的真偽。然而,這種神經網路目前只能一次學習一個人。
「你不能隨便找個人就把它的聲音轉化成奧巴馬的視頻。」賽茨說,「我們對此非常謹慎,不希望從某個人嘴裡說出其他人的話。我們只是把某人說過的話變成此人的視頻。」
未來,該演算法或許只需要使用1個小時的視頻就能識別某人的聲音和說話模式,而不必非要14小時的資料。
※EarFS技術能通過特殊耳塞檢測面部表情 進而控制智能手機
※美國民科造飛機上天,與中國農民發明家有啥不同
※投資者追捧比特幣 但零售商還是不太接受它
※《精靈寶可夢:究極太陽/月亮》將有鐵盒收藏版 80美元含兩款遊戲
※NASA公布首批木星「大紅斑」近照
TAG:cnbeta |
※搞笑GIF:牛逼的是口型也對上了
※巴鐵新導彈試射成功,疑似國產最強中距彈出口型號
※殲7出口型號和各國塗裝大對比,美也曾購買一型號用於此用途!
※讓去世親人「復生」?這項新技術做出的假視頻 口型和聲音幾可亂真
※TWICE Sana簽名會影片被韓網友扒出,對口型猜出對話被熱議!
※TVB女歌手失聲仍上台對口型演出 三度鞠躬落淚致歉
※AH-6S「小鳥」型的出口型
※【上海話配音的《三國演義》儂聽過伐?口型竟然全都對上了!】
※中國重型超音速導彈成功打入北非市場,被譽為最強出口型
※為什麼英語發音不標準,可能是口型惹的禍
※關曉彤口型對不上 網友調侃其是大型尷尬現場
※騰格爾疑似假唱卡路里,口型完全對不上,網友:為難老藝術家了
※關曉彤口型對不上被質疑假唱是怎麼回事 在線視頻觀看地址
※中國出口型VN18步戰車,為何被譽為海上「鋼鐵俠」?
※有種「沒文化」叫韓商言唱情歌,不光唱錯字,竟連口型都對不上!
※我國首次展示出口型反潛導彈!
※我很好奇!動漫人物的口型和台詞是如何對上的?
※利器還是噱頭—珠海航展公開首款出口型反艦彈道導彈
※《談判官》首播:楊冪戲份少,配音口型對不上,黃子韜演技受肯定
※晚會現場 l TVB女歌手失聲疑對口型 胡定欣緊張唱錯歌詞