python人工智慧-圖像識別

最新 01-27

安裝庫

首先我們需要安裝PIL和pytesseract庫。

PIL：（Python Imaging Library）是Python平台上的圖像處理標準庫，功能非常強大。

pytesseract：圖像識別庫。

我這裡使用的是python3.6，PIL不支持python3所以使用如下命令

如果是python2，則在命令行執行如下命令：

這時候我們去運行上面的代碼會發現如下錯誤：

錯誤提示的很明顯：

No such file or directory ："tesseract"

這是因為我們沒有安裝tesseract-ocr引擎

tesseract-ocr引擎

光學字元識別(OCR,Optical Character Recognition)是指對文本資料進行掃描，然後對圖像文件進行分析處理，獲取文字及版面信息的過程。OCR技術非常專業，一般多是印刷、列印行業的從業人員使用，可以快速的將紙質資料轉換為電子資料。關於中文OCR，目前國內水平較高的有清華文通、漢王、尚書，其產品各有千秋，價格不菲。國外OCR發展較早，像一些大公司，如IBM、微軟、HP等，即使沒有推出單獨的OCR產品，但是他們的研發團隊早已掌握核心技術，將OCR功能植入了自身的軟體系統。對於我們程序員來說，一般用不到那麼高級的，主要在開發中能夠集成基本的OCR功能就可以了。這兩天我查找了很多免費OCR軟體、類庫，特地整理一下，今天首先來談談Tesseract，下一次將討論下Onenote 2010中的OCR API實現。可以在這裡查看OCR技術的發展簡史。

Tesseract的OCR引擎最先由HP實驗室於1985年開始研發，至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而，HP不久便決定放棄OCR業務，Tesseract也從此塵封。

數年以後，HP意識到，與其將Tesseract束之高閣，不如貢獻給開源軟體業，讓其重煥新生－－2005年，Tesseract由美國內華達州信息技術研究所獲得，並求諸於Google對Tesseract進行改進、消除Bug、優化工作。

安裝tessercat-ocr引擎

然後我們通過看一下是否安裝成成功

這時候我們運行上面代碼會出現亂碼

這是因為默認只有語言包中沒有中文包，如下圖：