當前位置:
首頁 > 知識 > 電子科大PhD:基於深度學習的中文唇語識別

電子科大PhD:基於深度學習的中文唇語識別

分享背景

唇語識別,即通過運動的嘴唇,識別其說話內容。通過LSTM模型將CNN抽取出來的圖片特徵進行時序建模,最後引入Seq2Seq的翻譯模型將發音轉換成漢子。此次分享,會先簡單介紹現有的英文唇語識別的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),隨後對中文唇語識別展開詳細討論。

《Lip Reading Sentences in the Wild》

論文地址:https://arxiv.org/abs/1611.05358

《LipNet:sentence level lipreading》

論文地址:https://arxiv.org/abs/1611.01599v1

分享主題

基於深度學習的中文唇語識別

分享人簡介

戴錫笠,電子科技大學計算機系二年級博士生,他的研究方向在於計算機視覺,移動計算,深度學習。曾于海康威視研究院實習,研究內容為基於序列的行人再檢索。

分享時間

北京時間10月18日(周三) 20:00

參與方式

掃描海報二維碼,點擊底部菜單

如果你覺得活動不錯,歡迎點贊並轉發本文~


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 唯物 的精彩文章:

YOLO9000好棒好快好強壯 閱讀筆記
從數據採集與標記行業看數據與深度學習之關係
深度學習目標檢測概覽
下周學術青年分享會預告
DeepMind AI 是如何識別音視頻概念的?

TAG:唯物 |