python-tesseract

    0熱度

    1回答

    我通過Linux終端安裝的Tesseract OCR mudule,但是當我試圖將其導入在Python中,錯誤出現了: /usr/bin/python2.7 /home/web/Documents/pnt/ocr.py Traceback (most recent call last): File "/home/web/Documents/pnt/ocr.py", line 1, in impor

    3熱度

    2回答

    我在Pytesseract的屏幕截圖上運行大量OCR。這在大多數情況下都能正常工作,但是一小部分會導致此錯誤: pytesseract.image_to_string(image,None, False, "-psm 6") Pytesseract: UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 2:

    1熱度

    1回答

    我有一個遠程PDF文件,我需要逐頁閱讀並不斷向每個OCR傳遞OCR文本。 import pytesseract from pyPdf import PdfFileWriter, PdfFileReader import cStringIO from wand.image import Image import urllib2 import tempfile import pytesse

    0熱度

    1回答

    我從來沒有用過python,我不知道從哪裏開始。我的目標是拍攝數字和多彩背景的圖像數據,並可靠地獲取識別出的正確字符。我研究了必要的工具,並且我發現了Anaconda python發行版,它包含了我可能需要的所有可能的軟件包,以及tesseract-ocr和pytesser。 不幸的是,我迷失在如何開始。我「米使用PyCharm社區IDE,只是試圖按照本指南: http://www.manejan

    0熱度

    1回答

    到目前爲止,我的第一個障礙是在MTG卡的圖像上運行tesseract香草不會識別卡片標題(說實話這就是我需要的,因爲我可以使用該文本來拉出卡片信息的其餘部分從數據庫)我認爲這個問題可能是需要訓練tesseract認識字體在mtg卡的使用,但我想知道是否它可能是一個問題tesseract不尋找或不檢測圖像中的文本(特別是標題)。 編輯:包括MTG卡的圖像作爲參考。 http://gatherer.w

    6熱度

    2回答

    我想要使用pytesseract庫獲取圖像文件的字符位置。 import pytesseract from PIL import Image print pytesseract.image_to_string(Image.open('5.png')) 是否有讓人物的每一個位置任何庫

    0熱度

    3回答

    我已經使用pytesseract獲得了非常好的結果,但它無法保留雙重空間,它們對我來說非常重要。 而且,所以我決定檢索hocr輸出而不是純文本。但是;似乎沒有任何使用pytessearct指定配置文件的方式。 那麼,是否有可能使用pytesseract指定配置文件,或者是否有一些默認的配置文件,我可以更改爲獲取hocr輸出? #run method from pytessearct.py def

    0熱度

    1回答

    當我ssh我的應用程序,我試圖讓正方體: $wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz 它告訴我,我不能寫這個文件(拒絕) 所以,我可以安裝在的Tesseract openshift?

    -3熱度

    1回答

    我需要在我的家鄉的地區語言之一的python中實現OCR。 我搜索了四周,並閱讀了Tesseract OCR引擎。但它支持有限的語言。 如何去修改它以支持其他語言?

    1熱度

    1回答

    我有一個python腳本可以掃描收據,然後將其輸出到掃描文件中。在新文件上使用tesseract imagefile輸出文件。我可以得到很好的可讀文本,但解析如下所示。有沒有辦法使用tesseract在價格旁邊排列購買的物品?我的首選是使用PHP或Python。 WHELE POODS .4 M Merchant Name and Address 365 BHCON LS 365