當前位置:
首頁 > 科技 > 偽造視頻連口型都能對上:「語音對口型」AI出世

偽造視頻連口型都能對上:「語音對口型」AI出世

北京時間7月13日早間消息,研究人員開發了一種機器學習演算法,可以將聲音片段變成能口型一致的視頻內容。研究人員展示的這段視頻顯示了美國前總統巴拉克·奧巴馬(Barack Obama)談論恐怖主義等多個話題的場景,但這實際上卻是使用現有的視頻演講人工生成的片段。來自華盛頓大學的研究人員相信,該系統可以最終用於改進視頻通話,甚至確定某段視頻的真偽。



fake_obamas.0.gif


該系統對神經網路進行訓練,使之學會觀看人類講話的視頻,然後將音頻文件轉化成真實的口型。之後再將其嫁接到視頻中的人臉上。為了實現這一目標,他們將該校圖形實驗室之前的研究成果,與最新的口型合成技術結合起來。


該技術還可以實現小幅時移,從而讓神經網路預測說話者接下來所要表達的內容。該團隊之所以選擇奧巴馬,是因為這套系統需要14小時的視頻進行學習,而作為全世界上鏡率最高的人之一,奧巴馬顯然是最佳人選。


「Skype或Messenger這樣的視頻聊天工具未來可以讓任何人收集視頻,然後對電腦進行訓練。」華盛頓大學的伊拉·開梅爾馬切-什利澤曼(Ira Kemelmacher-Shlizerman)說。


由於通過互聯網傳輸音頻所需的帶寬遠低於視頻,所以這套新系統或許可以終結故障頻頻的視頻聊天。

「當你使用Skype或Google Hangouts聊天時,會發現連接不太順暢,解析度也很低,這令人很不高興,但音頻往往很好。」該論文的聯合作者、艾倫學院教授史蒂夫·賽茨(Steve Seitz)說,「所以,如果可以使用音頻生成更高質量的視頻,那就太好了。」


之前的音頻轉視頻技術重點是錄製多個人反覆說同一句話的視頻,然後嘗試捕捉聲音與不同口型之間的相關性。但這一過程成本高昂,而且非常耗時。


通過將這一過程調轉過來——將視頻提供給網路,而不僅僅是音頻——該團隊可能開發各種演算法來判斷一段視頻的真偽。然而,這種神經網路目前只能一次學習一個人。


「你不能隨便找個人就把它的聲音轉化成奧巴馬的視頻。」賽茨說,「我們對此非常謹慎,不希望從某個人嘴裡說出其他人的話。我們只是把某人說過的話變成此人的視頻。」


未來,該演算法或許只需要使用1個小時的視頻就能識別某人的聲音和說話模式,而不必非要14小時的資料。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 cnbeta 的精彩文章:

EarFS技術能通過特殊耳塞檢測面部表情 進而控制智能手機
美國民科造飛機上天,與中國農民發明家有啥不同
投資者追捧比特幣 但零售商還是不太接受它
《精靈寶可夢:究極太陽/月亮》將有鐵盒收藏版 80美元含兩款遊戲
NASA公布首批木星「大紅斑」近照

TAG:cnbeta |

您可能感興趣

搞笑GIF:牛逼的是口型也對上了
巴鐵新導彈試射成功,疑似國產最強中距彈出口型號
殲7出口型號和各國塗裝大對比,美也曾購買一型號用於此用途!
讓去世親人「復生」?這項新技術做出的假視頻 口型和聲音幾可亂真
TWICE Sana簽名會影片被韓網友扒出,對口型猜出對話被熱議!
TVB女歌手失聲仍上台對口型演出 三度鞠躬落淚致歉
AH-6S「小鳥」型的出口型
【上海話配音的《三國演義》儂聽過伐?口型竟然全都對上了!】
中國重型超音速導彈成功打入北非市場,被譽為最強出口型
為什麼英語發音不標準,可能是口型惹的禍
關曉彤口型對不上 網友調侃其是大型尷尬現場
騰格爾疑似假唱卡路里,口型完全對不上,網友:為難老藝術家了
關曉彤口型對不上被質疑假唱是怎麼回事 在線視頻觀看地址
中國出口型VN18步戰車,為何被譽為海上「鋼鐵俠」?
有種「沒文化」叫韓商言唱情歌,不光唱錯字,竟連口型都對不上!
我國首次展示出口型反潛導彈!
我很好奇!動漫人物的口型和台詞是如何對上的?
利器還是噱頭—珠海航展公開首款出口型反艦彈道導彈
《談判官》首播:楊冪戲份少,配音口型對不上,黃子韜演技受肯定
晚會現場 l TVB女歌手失聲疑對口型 胡定欣緊張唱錯歌詞