阿里達摩院開源語音識別模型DFSMN,準確率達96.04%
科技
06-08
Amoy 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
阿里巴巴達摩院又有新開源模型,這次是語音識別模型DFSMN。
近日,阿里達摩院機器智能實驗室開源了新一代語音識別模型DFSMN,基於世界最大的免費語音識別資料庫LibriSpeech,該模型將全球語音識別準確率紀錄提高至96.04%。
阿里方面稱,對比目前業界使用最為廣泛的LSTM模型,DFSMN模型訓練速度更快、識別準確率更高。
而採用全新DFSMN模型的智能音響或智能家居設備,相比前代技術深度學習訓練速度提到了3倍,語音識別速度提高了2倍。
相關詳情可移步開源地址:
https://github.com/tramphero/kaldi
—完—
活動報名
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※路透社:美國打算限制英偉達等與中國人工智慧界合作
※加州出台嚴格無人車路測新政:要求各公司儘快申請部署許可
TAG:量子位 |