當前位置:
首頁 > 最新 > 開源OCR文字識別軟體Calamari

開源OCR文字識別軟體Calamari

Calamari是一種新的開源OCR識別軟體,它使用了最先進的Tensorflow實現的深度神經網路(DNN)。 提供了預訓練模型和多模型投票技術。由卷積神經網路(CNNS)和長短時記憶(LSTM)層構成的可定製網路架構通過Graves等人的連接時間分類(CTC)演算法進行訓練。而GPU的使用大大減少了訓練和預測的計算時間。我們使用兩個不同的數據集來比較Calamari與OCRopy,OCRopus3和Tesseract 4的性能.Calamari在用現代英語寫的UW3數據集上達到0.11%的字元錯誤率(CER),在用德語寫的DTA19數據集上達到0.18% 錯誤率,其性能遠遠優於以上現有開源軟體的結果。

使用了目前OCR最先進的的技術,CNN+LSTM+CTC+voting。

calamari OCR引擎,使用Python3編寫,基於OCRopy和Kraken構建,它的設計使你既可以方便的使用命令行運行,也可以把它模塊化嵌入到其他python腳本中。

在UW3和DTA19上的識別結果錯誤率,與OCRopy、Tesseract4、OCropus3相比較:

與其他軟體相比的識別速度,有GPU加持當然很快:

值得注意的事,該庫主要是用來識別印刷體古籍文字,在自然場景圖像上的識別並沒有實驗說明。

文中識別所用的資料庫圖片示例:

ps.單詞「calamari」的意思是魷魚。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 計算機視覺與機器學習 的精彩文章:

Tile-based Optical Flow 演算法流程與基本思想

TAG:計算機視覺與機器學習 |