當前位置:
首頁 > 最新 > python人工智慧-圖像識別

python人工智慧-圖像識別

安裝庫

首先我們需要安裝PIL和pytesseract庫。

PIL:(Python Imaging Library)是Python平台上的圖像處理標準庫,功能非常強大。

pytesseract:圖像識別庫。

我這裡使用的是python3.6,PIL不支持python3所以使用如下命令

如果是python2,則在命令行執行如下命令:

這時候我們去運行上面的代碼會發現如下錯誤:

錯誤提示的很明顯:

No such file or directory :"tesseract"

這是因為我們沒有安裝tesseract-ocr引擎

tesseract-ocr引擎

光學字元識別(OCR,Optical Character Recognition)是指對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面信息的過程。OCR技術非常專業,一般多是印刷、列印行業的從業人員使用,可以快速的將紙質資料轉換為電子資料。關於中文OCR,目前國內水平較高的有清華文通、漢王、尚書,其產品各有千秋,價格不菲。國外OCR發展較早,像一些大公司,如IBM、微軟、HP等,即使沒有推出單獨的OCR產品,但是他們的研發團隊早已掌握核心技術,將OCR功能植入了自身的軟體系統。對於我們程序員來說,一般用不到那麼高級的,主要在開發中能夠集成基本的OCR功能就可以了。這兩天我查找了很多免費OCR軟體、類庫,特地整理一下,今天首先來談談Tesseract,下一次將討論下Onenote 2010中的OCR API實現。可以在這裡查看OCR技術的發展簡史。

Tesseract的OCR引擎最先由HP實驗室於1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。

數年以後,HP意識到,與其將Tesseract束之高閣,不如貢獻給開源軟體業,讓其重煥新生--2005年,Tesseract由美國內華達州信息技術研究所獲得,並求諸於Google對Tesseract進行改進、消除Bug、優化工作。

安裝tessercat-ocr引擎

然後我們通過看一下是否安裝成成功

這時候我們運行上面代碼會出現亂碼

這是因為默認只有語言包中沒有中文包,如下圖:

安裝tesseract-ocr語言包

我們去GitHub下載我們需要的語言包,這裡我只下載了和

github:tesseract-ocr/tessdata

然後放到路徑下面。

可以通過查看本地語言包:

可以通過 查看psm

0:定向腳本監測(OSD)

1: 使用OSD自動分頁

2 :自動分頁,但是不使用OSD或OCR(Optical Character Recognition,光學字元識別)

3 :全自動分頁,但是沒有使用OSD(默認)

4 :假設可變大小的一個文本列。

5 :假設垂直對齊文本的單個統一塊。

6 :假設一個統一的文本塊。

7 :將圖像視為單個文本行。

8 :將圖像視為單個詞。

9 :將圖像視為圓中的單個詞。

10 :將圖像視為單個字元。

為什麼這裡要強調語言包和psm,因為我們在使用中會用到,

比如多個語言包組合併且視為統一的文本塊將使用如下參數:

這裡我們通過來合併使用多個語言包。

接下來我們看一下配置好一切的正確結果。

此時大公告成。

或者掃一掃關注公眾號

GIF


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

我為什麼登山

TAG:全球大搜羅 |