當前位置:
首頁 > 新聞 > 谷歌開源語音命令數據集,幫助開發者搭建基礎的語音交互

谷歌開源語音命令數據集,幫助開發者搭建基礎的語音交互

谷歌開源語音命令數據集,幫助開發者搭建基礎的語音交互

谷歌的工程師們經常被問到這麼個問題:

怎麼上手用深度學習做語音識別或其它音頻識別,比如關鍵詞或指令?

雖然,現在出現了些很優秀的開源語音識別系統,比如 Kaldi,就能把神經網路作為其中的一個模塊。但其高度複雜性,讓它們並不適合作為解決簡單任務的指南。更重要的是,對於新手而言,免費、可公開獲取的數據集並不多,經過預處理的、或適合於簡單的關鍵詞檢測的也很少。

為解決這些問題,谷歌的 TensorFlow 和 AIY 團隊創建了Speech Commands Dataset,即「語音命令數據集」,並基於它向 TensorFlow 添加訓練和推理的示例代碼。

雷鋒網消息,谷歌在今日宣布開源該數據集。

對 30 個命令短語,該數據集有 65000 次的長約一秒鐘的發音。這來自數千個不同的人向 AIY 網站提交的貢獻。它以 Creative Commons BY 4.0 許可發布,隨著新貢獻的添加,該數據集在未來會不斷擴大。

建立這個數據集的目的,是幫助大家為應用創建基礎但有用的語音交互,比如「Yes」、「No」、數字、方向等詞語。谷歌也已經將開發這一數據集的基礎設施開源,並希望看到更多人藉此創建更多版本的數據集,尤其是針對冷門語言和應用。

下載預建的 TensorFlow 安卓演示 APP,打開 「TF Speech」,就能體驗谷歌基於該數據集開發的識別模型。另外,你可以通過 TensorFlow.org 的音頻識別 tutorial 學習怎麼開發你自己的模型。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

馬斯克超級隧道項目獲得許可,可挖2英里長的測試隧道
寶馬:打造中國式無人車 | 全球汽車AI大會

TAG:雷鋒網 |

您可能感興趣

華為開發人工智慧語音助手 支持情感交互
谷歌開源語音引擎:分享9大語音功能,為長篇對話提供字幕
智能語音助手:大陸集團開發車用自適應聲控數字伴侶
AI語音對話交互,開啟智能生活新篇章
依圖科技發布語音開放平台,聯袂微軟、華為撬動語音市場
搭載谷歌語音助手
谷歌開發車用語音助理,美國人的技術真的比較強嗎?
哈曼卡頓發布智能音箱新品 搭載谷歌語音助手
華為將開發海外版語音助手,與谷歌和亞馬遜競爭
開源中文語音識別軟體
海爾AWE將發布多款智能音箱 打開智慧家庭語音交互入口
布點語音在零一科技節震撼發布 語音助手不再是雞肋
阿里開源自主研發的 DFSMN 語音識別模型,引谷歌論文引用
華為稱將推出支持情感交互的智能語音助手
小度語音車載支架發布:支持語音交互、無線充電,價格真香
智能語音交互技術在媒體的應用和前景
搜狗發布「個性化語音識別」技術,語音輸入將更懂用戶
藉助全空間語音交互 長虹讓人工智慧技術「更親民」
語音助理/語音激活技術迅速崛起 鍵盤將死會否成真?
AIIA人工智慧開發者大會開啟在即,思必馳俞凱暢談語音交互技術的「AI互聯」