當前位置:
首頁 > 科技 > Mozilla開放源碼數據集 實現多語言語音識別

Mozilla開放源碼數據集 實現多語言語音識別

Mozilla正在擴展它的眾包通用語音項目,該項目旨在創建一個開源的語音識別數據集,以包含更多的語言。

這個科技組織在去年6月首次宣布了「共同聲音」,邀請來自世界各地的志願者通過網路和移動應用程序錄製文本片段。

Mozilla開放源碼數據集 實現多語言語音識別

這個項目與亞馬遜(Amazon)、谷歌、蘋果(Apple)和微軟(Microsoft)等公司正在開發的越來越多的專有語音識別技術形成了對比。上述巨頭正大舉投資於聲控數字助理Alexa、谷歌Assistant、Siri和Cortana,但各自的數據集都屬於這些公司自己。

去年11月,Mozilla發布了第一個英語通用語音數據集的成果,該數據集包含了大約500個小時的演講,從2萬人口中收集了40萬段錄音。今天,Mozilla正式開始為另外三種語言收集語音數據——法語、德語,還有一點隨意的威爾士語。另外40種語言正在為數據收集過程做準備,巴西葡萄牙語、中國語(台灣)、印度尼西亞語、波蘭語和荷蘭語等已經準備好開始眾包語音數據。

多年來,語音將成為技術領域的下一個大型平台,這一點是顯而易見的。就在昨天,亞馬遜(Amazon)正式發布了新的內置攝像頭、支持alexa功能的Echo Look智能揚聲器,可以告訴你該穿什麼。我們仍處在這一運動的早期,但很明顯,聲音只會變得更加普遍。

正是在這種背景下,Mozilla正在推進創建一個開源數據集的計劃,任何人都可以自由地使用該數據集,將語音識別智能構建到各種應用程序和服務中。

Mozilla開放源碼數據集 實現多語言語音識別

Mozilla的首席創新官凱瑟琳娜·博切特(Katharina Borchert)在一篇博客文章中說:「我們認為,這些界面不應該由少數公司作為語音服務的把關人來控制,我們希望用戶能夠始終以自己的語言和口音被理解。」

通用語音項目的目的和其他開放許可項目的目的類似,這些項目都是針對私有平台的。OpenStreetMap是類似眾包項目的一個很好的例子,該項目為開發人員提供開放的、可自由使用的世界地圖,而不需要像谷歌maps這樣的競爭服務的成本或限制。

Mozilla開放源碼數據集 實現多語言語音識別

在可及性方面,在許多方面,英語可能是互聯網的通用語,但事實仍然是,大多數人說的不是英語,而是母語。隨著人工智慧語音識別革命的深入發展,任何為開發人員和技術人員提供多語言數據集來訓練機器學習模型的東西都只能是件好事。

Mozilla共同語音項目的數字戰略家Michael Henretty補充說:「多語種語音標誌著普通語音的一大步,我們希望它也是語音技術的一大步。」「讓語音技術民主化不僅會降低全球創新的障礙,還會降低獲取信息的障礙。」

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智鋒號 的精彩文章:

Blind是一個獨特的VR遊戲 它使用回聲定位來探秘
英特爾關閉了新設備組 解散AR智能眼鏡背後團隊

TAG:智鋒號 |