0

我試過了這個例子來提取掃描文檔的文本,https://github.com/madmaze/pytesseract如何使用python

import Image 
import pytesseract 

print pytesseract.image_to_string(Image.open('image1.png')) 

四處錯誤: 文件 「/usr/lib/python2.7/subprocess.py」,線1327,在_execute_child提高child_exception OSError:[Errno 2]沒有這樣的文件或目錄

是否有任何其他方式從掃描文檔中提取文本?

+1

這有什麼錯呀? – timgeb

+0

文件 「/usr/lib/python2.7/subprocess.py」,線1327,在_execute_child 提高child_exception OSERROR:[錯誤2]沒有這樣的文件或目錄 – vikrant

+0

得到這個錯誤 – vikrant

回答

0

我發現這個問題,

更新:

/usr/local/lib/python2.7/dist-packages/pytesseract/pytesseract.py 

tesseract_cmd = 'tesseract' =====>> tesseract_cmd = '/usr/local/bin/tesseract' 

而現在它的工作。

+0

這很奇怪,'/ usr/local/bin'默認應該在你的搜索路徑中。 – sashoalm

+0

我嘗試過,但精度較低,任何其他包可用於相同的功能。 – vikrant

-2

使用以下命令

命令和apt-get安裝的Tesseract-OCR

+1

從回溯和以下的討論中,你可以看到問題與'PIL' /'pillow'完全沒有關係。 – iled