9
我必須將包含掃描圖像的.pdf文件轉換爲.txt文件文件。 tesseract ocr只將圖像轉換爲.txt。但我需要先提取.tif圖像然後轉換它。任何人都可以幫助我嗎?使用tesseract將掃描的PDF轉換爲.txt文件
我必須將包含掃描圖像的.pdf文件轉換爲.txt文件文件。 tesseract ocr只將圖像轉換爲.txt。但我需要先提取.tif圖像然後轉換它。任何人都可以幫助我嗎?使用tesseract將掃描的PDF轉換爲.txt文件
使用ImageMagick的:
convert -density 600 input.pdf output.tif
密度在DPI,從我的經驗,600 DPI達到最好效果。
轉換命令可以用來產生多個輸出文件嗎?請幫助我使用它。 –
@GaneshNannaware是的,它可以。將'%04d'放在輸出文件的名稱中,看看它是如何工作的。 –
Thanx很多@Karol S –