python-tesseract

    1熱度

    1回答

    我是計算機視覺領域的新手。 我想用Tesseract來檢測寫在卡車側面的數字。 因此,對於這個例子,我想看看CMA CGM作爲輸出。 我饋送此圖片超正方體經由命令行 tesseract image.JPG out -psm 6 ,但它產生了一個空白文件。 然後我讀Tesserocr的文件(正方體的Python包裝),並試圖將以下代碼 with PyTessBaseAPI() as api:

    -1熱度

    1回答

    我剛剛開始首次使用Spark進行OCR任務,我有一個包含掃描文本文檔的PDF文件的文件夾,我想將其轉換爲純文本。我首先創建文件夾中所有pdf的並行數據集,然後執行Map操作來創建圖像。我使用魔杖圖像來完成這項任務。最後,我使用pytesseract來完成OCR,這是Tesseract的封裝。 我使用這種方法的問題是內存使用量隨着每個新文檔的增加而增加,最後我得到一個錯誤「os無法分配內存」。我感覺

    2熱度

    1回答

    我有相當簡單的圖片,但tesseract沒有成功給我正確的答案。 代碼: pytesseract.image_to_string(image, lang='eng') 例畫面給人的 SARVN PRIM E N EU ROPTICS\nBLU EPRINT 結果我也試圖以我自己的單詞添加到字典中,如果它讓更好的東西,但仍然沒有。 pytesseract.image_to_string(im

    0熱度

    1回答

    我正在使用Postman將base64映像發送到我的Apache Web服務器上的PHP文件。圖像始終成功發送。 PHP腳本執行python腳本以從圖像中提取文本(使用Pytesseract/Tesseract-OCR)並將輸出發送回PHP。 (使用Windows 10,如果有的話) 前兩個打印語句總是在Postman中返回,但第三個和第四個打印語句不返回。僅當pytesseract行被註釋掉時,

    1熱度

    1回答

    我正在運行python 2.6.6並且想要安裝pytesseract包。解壓縮和安裝後,我可以從命令行調用pytesseract。但是我想在Python中運行tesseract。我有以下代碼(ocr.py): try: import Image except ImportError: from PIL import Image import pytesseract pri

    1熱度

    1回答

    我想用Boost優化我的Python程序,並用C++函數替換一些Python代碼。 Python代碼: from PIL import Image for i in xrange(len(lines)): im = Image.fromarray(lines[i]) line = pytesseract.image_to_string(im, "ukr+ukrb") # wo

    0熱度

    1回答

    是否可以使用pyocr或Tesseract從圖像中獲取字體大小? 以下是我的代碼。 tools = pyocr.get_available_tools() tool = tools[0] txt = tool.image_to_string( Imagee.open(io.BytesIO(req_image)), lang=lang, builder=pyoc

    3熱度

    1回答

    我正在嘗試做火車或卡車等車輛的OCR來識別寫在其上的數字和字符。 (請注意這不是車牌識別OCR) 我拍了這張照片。這個想法是能夠提取文字 - BN SF 721 734寫在它上面。 對於前處理,我先轉換此圖片灰度,然後將其轉換成看起來像這樣 我在正方體寫一些代碼的二進制圖像。 myimg = "image.png" image = Image.open(myimg) with PyTessBa

    1熱度

    1回答

    我正在嘗試與Tesseract API並行學習Python。我的最終目標是學習如何使用Tesseract API來讀取文檔並進行一些基本的錯誤檢查。我發現幾個例子似乎是開始的好地方,但我很難理解兩段代碼之間的差異,儘管行爲不同,但在我看來,它們應該是等價的。這些都從https://pypi.python.org/pypi/tesserocr略有修改。 第一個例子產生這樣的輸出: $ time ./

    0熱度

    2回答

    我在Windows上使用10 x64 pytesseract錯誤打開數據文件,蟒蛇是3.5.2 x64,正方體是4.0,代碼如下: # -*- coding: utf-8 -*- try: import Image except ImportError: from PIL import Image import pytesseract print(pytesser