當前位置:
首頁 > 科技 > 麻省理工學院新研究:通過聲音猜測人臉

麻省理工學院新研究:通過聲音猜測人臉

6月7日消息,麻省理工學院的研究人員訓練了一個機器學習模型,只需根據一段簡短的音頻剪輯,就能重建出一個人非常粗糙的面部輪廓。

麻省理工學院的研究人員在Arxiv網站發表的一項研究中,創造了一種基於一小段音頻剪輯來重建一些人粗糙相貌的方法。論文《Speech2Face:學習語音背後的面孔》,描述了他們如何從YouTube上獲取數百萬個剪輯組成的數據集,並創建了一個基於神經網路的模型,用於學習與視頻中面部特徵相關的聲音屬性。現在,當系統聽到一個新的聲音片段時,人工智慧可以使用它學到的東西來猜測人臉的樣子。

麻省理工學院的研究人員確實承認了論文中的隱私問題,並在「倫理考慮」部分解釋說,Speech2Face通過訓練可以捕捉性別和年齡等常見的視覺特徵,並且只有當聲音中有足夠的證據時才這樣做。換句話說,該系統並沒有嘗試或能夠生成特定人物的圖像。

儘管如此,研究人員推測,人工智慧可能會支持一些應用,比如根據說話者的聲音在語音或視頻通話中附加一個代表性的面孔。

當然,最終產生的圖像是非常粗糙的。但總體而言,其中許多照片的年齡、種族和性別都是正確的。之前的研究已經探索了通過語言預測年齡和性別的方法,但在這個案例中,研究者聲稱他們也發現了與一些面部模式的相關性。他們寫道:「除了這些主要特徵,我們的重建揭示了顱面部特徵(如鼻子結構)和聲音之間不可忽視的相關性。」

從可以在照片中自動標註某人的演算法,到輸入的文字可以用某人的聲音讀出來,再到用一種方法從聲音中分辨出人臉是什麼樣的,人工智慧變得越來越強大的同時,正讓每個置身其中的人變得越來越透明,其帶來的隱私問題值得我們關注。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 天極網 的精彩文章:

屏幕大才夠爽!75吋私人劇場電視推薦
亞馬遜日本恢復銷售華為手機 美國對華為的禁令正在逐漸放鬆?

TAG:天極網 |