當前位置:
首頁 > 最新 > 科大訊飛:AI數據團隊從60人壯大至200人

科大訊飛:AI數據團隊從60人壯大至200人

「我們『AI數據資源處理中心』貴州團隊是去年10月在貴州(清鎮)職教城公共實訓中心智能呼叫園區成立的,成立初期,團隊只有60人。」清鎮市貴州訊飛科技有限公司總經理董茂嬌說,在清鎮市委市政府和相關部門的大力支持下,經過半年多的努力,公司現在已經步入良好發展階段。

科大訊飛股份有限公司接手的第一個項目是語音資源分析。

董茂嬌介紹,當初,科大訊飛啟動保護方言計劃,考慮到雲貴川地域方言都有一定的共通性,所以公司接入了四川方言語音數據進行加工。

沒想到萬事開頭難,原本預想很簡單的項目出現了很多沒有預估到的情況:數據資源處理行業經驗為零;文字的實時識別轉寫因為拼音輸入法的習慣,一不注意就會多字或出現同音錯字;而方言識別後還需深度理解學習,需要人工進行標準文字注釋;還有就是對話數據內需要區別標點符號的應用,需要前後語句理解來判別語氣,根據語氣詞增加語氣標點符號等。

「第一期的數據沒達標,團隊的小夥伴們都很苦惱。」董茂嬌說,大家又開始探討解決辦法:「我們考察了數據正確率比較高的部分優秀人員組成幫扶責任小組,採用一帶三小團隊進行技巧輔導及質量監控;選出四川籍的成員成立了方言培訓小組,教大家『四川話』理解;還有的小夥伴編寫了『標點符號使用大全』,通過項目實踐統一完善符號添加規則,規避了因主觀臆斷導致符號添加錯誤的情況。那段時間,為了保障數據完成的進度和質量,晚上10點,辦公室還是燈火通明……」功夫不負有心人,經過近半個月的磨練,數據處理達到了使用標準。

現在,科大訊飛AI數據資源處理團隊已經有200餘人,主要從事大規模工程化數據資源、數據深度加工、數據分析處理等服務,可獨立處理AI數據資源庫分析、精資料庫資源及數據服務覆蓋語音合成、語音識別機交互技術領域等多項工作。

來源:根據貴陽日報編輯整理

編輯:蓋娟

審核:楊珊


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 微觀清鎮 的精彩文章:

TAG:微觀清鎮 |