我在目錄中有多個圖像並希望將其從圖像轉換爲文本文件。我必須在終端上手動執行。這是頭痛的過程。所以,我的問題是如何在包含圖像的文件夾上運行我的代碼。使用python在整個目錄上執行Tesseract OCR
這裏是終端命令將其轉換成文本:
convert captcha.png -resize 200% -type Grayscale input.tif #instead of input.tif i want same file name so, i can recognise easily
tesseract -l eng input.tif output #output name as same as file name
使用pytesseract glob的與我 – n1c9
試過,但圖像的文本結果是相當可怕的這個作品非常適合我。有什麼辦法嗎? – wizard
使用'subprocess.call'在各種文件上調用shell命令,並使用glob查找文件名。 – n1c9