麻省理工學院新研究：通過聲音猜測人臉

科技 06-10

6月7日消息，麻省理工學院的研究人員訓練了一個機器學習模型，只需根據一段簡短的音頻剪輯，就能重建出一個人非常粗糙的面部輪廓。

麻省理工學院的研究人員在Arxiv網站發表的一項研究中，創造了一種基於一小段音頻剪輯來重建一些人粗糙相貌的方法。論文《Speech2Face：學習語音背後的面孔》，描述了他們如何從YouTube上獲取數百萬個剪輯組成的數據集，並創建了一個基於神經網路的模型，用於學習與視頻中面部特徵相關的聲音屬性。現在，當系統聽到一個新的聲音片段時，人工智慧可以使用它學到的東西來猜測人臉的樣子。

麻省理工學院的研究人員確實承認了論文中的隱私問題，並在「倫理考慮」部分解釋說，Speech2Face通過訓練可以捕捉性別和年齡等常見的視覺特徵，並且只有當聲音中有足夠的證據時才這樣做。換句話說，該系統並沒有嘗試或能夠生成特定人物的圖像。

儘管如此，研究人員推測，人工智慧可能會支持一些應用，比如根據說話者的聲音在語音或視頻通話中附加一個代表性的面孔。

當然，最終產生的圖像是非常粗糙的。但總體而言，其中許多照片的年齡、種族和性別都是正確的。之前的研究已經探索了通過語言預測年齡和性別的方法，但在這個案例中，研究者聲稱他們也發現了與一些面部模式的相關性。他們寫道：「除了這些主要特徵，我們的重建揭示了顱面部特徵(如鼻子結構)和聲音之間不可忽視的相關性。」

從可以在照片中自動標註某人的演算法，到輸入的文字可以用某人的聲音讀出來，再到用一種方法從聲音中分辨出人臉是什麼樣的，人工智慧變得越來越強大的同時，正讓每個置身其中的人變得越來越透明，其帶來的隱私問題值得我們關注。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 天極網 的精彩文章:

TAG:天極網 |