python-tesseract

    0熱度

    1回答

    我試圖安裝tesserocr包在Windows10主機操作系統蟒蛇 我收到以下錯誤 pip install tesserocr 執行 pip install tesserocr Collecting tesserocr Using cached tesserocr-2.1.3.tar.gz Building wheels for collected packages: tesse

    1熱度

    1回答

    我製作了一個腳本,藉助於tesseract和pyocr將pdf掃描批量處理爲文本。代碼如下。問題在於,在處理大量文件時(例如20+),在某個時刻,腳本內存不足,OSError失敗。我目前已經做到這一點,以便在手動重新啓動後可以平穩地趕上崩潰的地方,但這些手動重新啓動很乏味。因爲pyocr對我來說基本上是一個黑盒子,所以我試圖將腳本包裝到其他Python腳本中,以便在崩潰時重新啓動腳本,但是它們似乎

    1熱度

    1回答

    我工作的一個項目,需要字符識別作爲它的一部分。我正在使用IAM的手寫數據集,因此所有圖像或多或少都會在相同的條件下拍攝。我使用的是已被數據集提供單詞的圖片,按照以下步驟 二值化和閾值​​ 劃分的話進入到人物構成它 重新調整所提取的字符 讓正方體圖出什麼英文字母是 我想要實現的是將一個人的文檔的字符存儲在按字母和mayb分類的文件夾中然後再從他們那裏形成一個模板。爲此,我需要知道它是哪個角色。 這是

    0熱度

    1回答

    我想用PyTesseract做一些圖像OCR,並且我已經看到OpenCV的侵蝕和擴張功能對噪聲去除預處理非常有用。 既然PyTesseract已經需要PIL/Pillow,我想在PIL中去除噪音,而不是去另一個庫。在PIL中是否有相當於腐蝕/擴張? (我的研究似乎表明,MaxFilter和MinFilter可以這樣使用,但是如果確實如此,它並不完全清楚。) 謝謝!

    0熱度

    2回答

    我需要關於tesseract的建議。我嘗試使用Tesseract,但結果並不完美。很多信息缺失。我想掃描法國車輛的註冊證書,我必須將數據恢復到數據庫中。你可以在文件下面找到它是法國註冊證書。是否有可能檢測到本文檔中的每個區域並將這些信息保存在數據庫中?我已經在互聯網上閱讀過,只有Tesseract才能檢測到區域? 你有例如區域A,B,C.1,D.2.1。如何檢測/掃描每個區域並將這些信息插入數據庫

    0熱度

    1回答

    我試過很多方法來安裝Tesseract,但我似乎無法得到它的工作。我在Mac上,這是我不斷收到的錯誤 txt = pytesseract.image_to_string(image, lang='eng') File "/Users/user/anaconda/lib/python2.7/site-packages/pytesseract/pytesseract.py", line 16

    5熱度

    1回答

    我已經有最新建立的leptonica和正方體 tesseract 4.00.00alpha-365-gcf0b378 leptonica-1.74.1 libjpeg 8d (libjpeg-turbo 1.3.0) : libpng 1.2.50 : libtiff 4.0.3 : zlib 1.2.8 我還安裝了像Python-dev的 所有依賴 這是我得到的錯誤,當我做點安裝

    -1熱度

    2回答

    這兩個軟件包有什麼區別? pip3 install pytesseract pip3 install tesseract

    0熱度

    1回答

    當我使用pytesseract的image_to_string函數,它會拋出OSError: [Errno 2] No such file or directory。完整的錯誤消息是here。當我使用subprocess.call(["tesseract", "inputfile.png", "outputfile"])時會發生同樣的情況。其他建議都表示我需要安裝tesseract,並且能夠在命令

    1熱度

    2回答

    我不斷收到同樣的錯誤,當我嘗試安裝 (env) [email protected]:~$ pip install tesserocr Collecting tesserocr Using cached tesserocr-2.1.3.tar.gz Building wheels for collected packages: tesserocr Running setup.