2017-03-16 152 views
2

我的目標是在Windows 7機器上使用Tesseract在Python 2.7中使用OCR,但是我遇到了與安裝過程相關的問題。我試着按照指令here,但「tesseract-core-yyyymmdd.exe」和「tesseract-langs-yyyymmdd.exe」的鏈接不再存在,我無法在網上找到這些.exe文件。這是我迄今爲止所做的:Python:爲Windows 7安裝Tesseract

  1. 從官方tesseract-ocr頁面的可執行文件安裝了tesseract。
  2. 通過pip包「魔杖」,「PIL」,「pyocr」安裝。現在

,如果我這樣做在Python如下:

from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io

沒有問題加載了這些包,但pyocr.get_available_tools()給我一個空列表。我相信這與上面缺少的安裝.exe文件有關。我可以在哪裏找到它們?我錯過了什麼?

回答

0

我只是試圖設置pytesseract,它的工作原理!我安裝了Windows 10和Python 2.7。

所有你需要做的:

  1. 下載Visual基本的C++從http://aka.ms/vcpython27並安裝它通過此鏈接https://pypi.python.org/pypi/pytesseract

  2. Unizip文件(常見的安裝步驟)從蟒蛇

  3. 下載正方體。

  4. 進入該目錄包含了unizip文件

  5. 運行此命令,如果它的安裝「蟒蛇的setup.py安裝」

  6. (附加)來測試,去你的Python程序,並運行這個命令「import pytesseract」

我希望它的作品!請注意pytesseract是基於谷歌的OCR,它與tesseract類似。