電子科大PhD:基於深度學習的中文唇語識別
分享背景
唇語識別,即通過運動的嘴唇,識別其說話內容。通過LSTM模型將CNN抽取出來的圖片特徵進行時序建模,最後引入Seq2Seq的翻譯模型將發音轉換成漢子。此次分享,會先簡單介紹現有的英文唇語識別的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),隨後對中文唇語識別展開詳細討論。
《Lip Reading Sentences in the Wild》
論文地址:https://arxiv.org/abs/1611.05358
《LipNet:sentence level lipreading》
論文地址:https://arxiv.org/abs/1611.01599v1
分享主題
基於深度學習的中文唇語識別
分享人簡介
戴錫笠,電子科技大學計算機系二年級博士生,他的研究方向在於計算機視覺,移動計算,深度學習。曾于海康威視研究院實習,研究內容為基於序列的行人再檢索。
分享時間
北京時間10月18日(周三) 20:00
參與方式
掃描海報二維碼,點擊底部菜單
如果你覺得活動不錯,歡迎點贊並轉發本文~


※YOLO9000好棒好快好強壯 閱讀筆記
※從數據採集與標記行業看數據與深度學習之關係
※深度學習目標檢測概覽
※下周學術青年分享會預告
※DeepMind AI 是如何識別音視頻概念的?
TAG:唯物 |