Alexa又添新技能：用純正的播音員聲音讀新聞

新聞 11-25

亞馬遜的Alexa又在繼續學習新技能，將可以被用於進行專業的新聞解讀，幾周後，具有「播音員風格」的聲音即會被內置於Alexa中。

打開今日頭條，查看更多精彩圖片

9月初，亞馬遜智能家居副總裁Daniel Rausch在IFA大會上公布了Alexa的各項數據：全球範圍內，Alexa已經擁有50,000個技能，與20,000種設備兼容，並與超過3,500個品牌合作。

據雷鋒網了解，在2018年年初，Alexa的公布數據還只有4，000種設備，1,200個品牌。幾個月時間，各方數據上漲都很快。

Alexa又添新技能：用純正的播音員聲音讀新聞

雷鋒網註：NTTS技術和傳統的TTS技術對比

亞馬遜稱，Alexa新的語音運用了公司開發的 NTTS（neural text-to-speech）技術，這種新一代語音合成技術可以更快地使用機器學習來生成富有表現力的聲音。

目前，Alexa使用的是銜接語音合成（concatenative speech synthesis），這種方法已經存在了幾十年。該技術將語音樣本分解成獨立的聲音音素，然後縫合在一起形成新的單詞和句子。

Alexa又添新技能：用純正的播音員聲音讀新聞

雷鋒網註：銜接語音合成示意圖

固然，銜接語音合成效果不錯，但新的融入AI技術的方法正在將其迅速迭代。去年10月，谷歌為其谷歌助手採用了一種新型語音合成方法，該方法使用了DeepMind AI實驗室最新開發的機器學習技術。

亞馬遜稱，未來幾周內將把Alexa的聲音切換成使用神經語音合成的新語音(完整的新聞播音員的聲音)。

播音員說話的聲音來自於現實生活中新聞頻道的錄音音頻片段，然後使用了機器學習技術識別模仿，使機器可以像播音員一樣讀新聞。

亞馬遜的AI語音負責人Trevor Wood表示，這種方法更容易捕獲人類講話風格的細節。「這其間的細微差別很難用語言描述，但顯然，使用AI技術，以數據驅動，可以比人類更有效地捕捉和模擬這些細節」。

值得注意的是，亞馬遜說，他們只花了幾個小時來訓練Alexa的「新聞播音員」聲音，這表明未來亞馬遜應該還會為Alexa開發出一系列的人類聲音風格。

到目前為止，亞馬遜已經添加了Alexa耳語模式，再加上幾周內將更新的「新聞播音員」聲音，我們有望在2019年聽到Alexa模仿更多的不同風格的聲音。

via: The Verge

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章: