python-tesseract

0熱度

1回答

在Ubuntu成功地安裝tesseract_ocr後，也沒有任何一個名爲tesseract_ocr

我通過Linux終端安裝的Tesseract OCR mudule，但是當我試圖將其導入在Python中，錯誤出現了： /usr/bin/python2.7 /home/web/Documents/pnt/ocr.py Traceback (most recent call last): File "/home/web/Documents/pnt/ocr.py", line 1, in impor

3熱度

2回答

Pytesseract：UnicodeDecodeError：'charmap'編解碼器無法解碼字節

我在Pytesseract的屏幕截圖上運行大量OCR。這在大多數情況下都能正常工作，但是一小部分會導致此錯誤： pytesseract.image_to_string(image,None, False, "-psm 6") Pytesseract: UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 2:

1熱度

1回答

將遠程PDF的頁面轉換爲OCR的臨時圖像

我有一個遠程PDF文件，我需要逐頁閱讀並不斷向每個OCR傳遞OCR文本。 import pytesseract from pyPdf import PdfFileWriter, PdfFileReader import cStringIO from wand.image import Image import urllib2 import tempfile import pytesse

0熱度

1回答

Windows上的Python OCR入門？

我從來沒有用過python，我不知道從哪裏開始。我的目標是拍攝數字和多彩背景的圖像數據，並可靠地獲取識別出的正確字符。我研究了必要的工具，並且我發現了Anaconda python發行版，它包含了我可能需要的所有可能的軟件包，以及tesseract-ocr和pytesser。不幸的是，我迷失在如何開始。我「米使用PyCharm社區IDE，只是試圖按照本指南： http://www.manejan

0熱度

1回答

在MTG卡上使用tesseract

到目前爲止，我的第一個障礙是在MTG卡的圖像上運行tesseract香草不會識別卡片標題（說實話這就是我需要的，因爲我可以使用該文本來拉出卡片信息的其餘部分從數據庫）我認爲這個問題可能是需要訓練tesseract認識字體在mtg卡的使用，但我想知道是否它可能是一個問題tesseract不尋找或不檢測圖像中的文本（特別是標題）。編輯：包括MTG卡的圖像作爲參考。 http://gatherer.w

6熱度

2回答

如何在pytesseract中獲取字符位置

我想要使用pytesseract庫獲取圖像文件的字符位置。 import pytesseract from PIL import Image print pytesseract.image_to_string(Image.open('5.png')) 是否有讓人物的每一個位置任何庫

0熱度

3回答

如何使用python-tesseract獲取Hocr輸出

我已經使用pytesseract獲得了非常好的結果，但它無法保留雙重空間，它們對我來說非常重要。而且，所以我決定檢索hocr輸出而不是純文本。但是;似乎沒有任何使用pytessearct指定配置文件的方式。那麼，是否有可能使用pytesseract指定配置文件，或者是否有一些默認的配置文件，我可以更改爲獲取hocr輸出？ #run method from pytessearct.py def

0熱度

1回答

如何在OpenShift中安裝TesseractOCR？

當我ssh我的應用程序，我試圖讓正方體： $wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz 它告訴我，我不能寫這個文件（拒絕）所以，我可以安裝在的Tesseract openshift？

-3熱度

1回答

在python中爲本地語言實現OCR

我需要在我的家鄉的地區語言之一的python中實現OCR。我搜索了四周，並閱讀了Tesseract OCR引擎。但它支持有限的語言。如何去修改它以支持其他語言？

1熱度

1回答

Python/PHP Tesseract輸出優化技巧

我有一個python腳本可以掃描收據，然後將其輸出到掃描文件中。在新文件上使用tesseract imagefile輸出文件。我可以得到很好的可讀文本，但解析如下所示。有沒有辦法使用tesseract在價格旁邊排列購買的物品？我的首選是使用PHP或Python。 WHELE POODS .4 M Merchant Name and Address 365 BHCON LS 365