偽造視頻連口型都能對上：「語音對口型」AI出世

科技 07-13

北京時間7月13日早間消息，研究人員開發了一種機器學習演算法，可以將聲音片段變成能口型一致的視頻內容。研究人員展示的這段視頻顯示了美國前總統巴拉克·奧巴馬（Barack Obama）談論恐怖主義等多個話題的場景，但這實際上卻是使用現有的視頻演講人工生成的片段。來自華盛頓大學的研究人員相信，該系統可以最終用於改進視頻通話，甚至確定某段視頻的真偽。

fake_obamas.0.gif

該系統對神經網路進行訓練，使之學會觀看人類講話的視頻，然後將音頻文件轉化成真實的口型。之後再將其嫁接到視頻中的人臉上。為了實現這一目標，他們將該校圖形實驗室之前的研究成果，與最新的口型合成技術結合起來。

該技術還可以實現小幅時移，從而讓神經網路預測說話者接下來所要表達的內容。該團隊之所以選擇奧巴馬，是因為這套系統需要14小時的視頻進行學習，而作為全世界上鏡率最高的人之一，奧巴馬顯然是最佳人選。

「Skype或Messenger這樣的視頻聊天工具未來可以讓任何人收集視頻，然後對電腦進行訓練。」華盛頓大學的伊拉·開梅爾馬切-什利澤曼（Ira Kemelmacher-Shlizerman）說。

由於通過互聯網傳輸音頻所需的帶寬遠低於視頻，所以這套新系統或許可以終結故障頻頻的視頻聊天。

「當你使用Skype或Google Hangouts聊天時，會發現連接不太順暢，解析度也很低，這令人很不高興，但音頻往往很好。」該論文的聯合作者、艾倫學院教授史蒂夫·賽茨（Steve Seitz）說，「所以，如果可以使用音頻生成更高質量的視頻，那就太好了。」

之前的音頻轉視頻技術重點是錄製多個人反覆說同一句話的視頻，然後嘗試捕捉聲音與不同口型之間的相關性。但這一過程成本高昂，而且非常耗時。

通過將這一過程調轉過來——將視頻提供給網路，而不僅僅是音頻——該團隊可能開發各種演算法來判斷一段視頻的真偽。然而，這種神經網路目前只能一次學習一個人。

「你不能隨便找個人就把它的聲音轉化成奧巴馬的視頻。」賽茨說，「我們對此非常謹慎，不希望從某個人嘴裡說出其他人的話。我們只是把某人說過的話變成此人的視頻。」

未來，該演算法或許只需要使用1個小時的視頻就能識別某人的聲音和說話模式，而不必非要14小時的資料。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 cnbeta 的精彩文章:

※EarFS技術能通過特殊耳塞檢測面部表情進而控制智能手機
※美國民科造飛機上天，與中國農民發明家有啥不同
※投資者追捧比特幣但零售商還是不太接受它
※《精靈寶可夢：究極太陽/月亮》將有鐵盒收藏版 80美元含兩款遊戲
※NASA公布首批木星「大紅斑」近照

TAG:cnbeta |

您可能感興趣

※搞笑GIF：牛逼的是口型也對上了
※巴鐵新導彈試射成功，疑似國產最強中距彈出口型號
※殲7出口型號和各國塗裝大對比，美也曾購買一型號用於此用途！
※讓去世親人「復生」？這項新技術做出的假視頻口型和聲音幾可亂真
※TWICE Sana簽名會影片被韓網友扒出，對口型猜出對話被熱議！
※TVB女歌手失聲仍上台對口型演出三度鞠躬落淚致歉
※AH-6S「小鳥」型的出口型
※【上海話配音的《三國演義》儂聽過伐？口型竟然全都對上了！】
※中國重型超音速導彈成功打入北非市場，被譽為最強出口型
※為什麼英語發音不標準，可能是口型惹的禍
※關曉彤口型對不上網友調侃其是大型尷尬現場
※騰格爾疑似假唱卡路里，口型完全對不上，網友：為難老藝術家了
※關曉彤口型對不上被質疑假唱是怎麼回事在線視頻觀看地址
※中國出口型VN18步戰車，為何被譽為海上「鋼鐵俠」？
※有種「沒文化」叫韓商言唱情歌，不光唱錯字，竟連口型都對不上！
※我國首次展示出口型反潛導彈！
※我很好奇！動漫人物的口型和台詞是如何對上的？
※利器還是噱頭—珠海航展公開首款出口型反艦彈道導彈
※《談判官》首播：楊冪戲份少，配音口型對不上，黃子韜演技受肯定
※晚會現場 l TVB女歌手失聲疑對口型胡定欣緊張唱錯歌詞