我需要一個實用程序批量轉換TIFF文件爲可轉位PDF。該軟件需要在Linux上運行,並且必須從命令行運行。該軟件不需要是開源的。我已經嘗試使用tesseract和hocr2pdf進行轉換,但是它們會生成帶有亂碼文本的PDF(注意:如果您在PDF中選擇所有文本,文本只會顯示爲亂碼)。我發現了其他實用程序,但它們只能在Windows下運行,或者不能從命令行運行。提前致謝。命令行軟件批量轉換TIFF爲可轉位PDF
回答
嘗試過幾種工具(包括Abbyy)後,我決定:Vividata。他們有合適的價格,在Linux下運行,並且每年沒有頁面限制。
這個答案是傾斜的,只有部分。如果它不適用於你,則不予理會。
可能存在這樣的軟件,但我不熟悉它。如果您的需求足夠強大,以至於您可以編寫2000行代碼以滿足它,那麼面向Linux的Libpoppler,可以爲您提供編寫程序的界面,以製作自己的自定義PDF,完全按照您的需要它。不幸的是,Libpoppler雖然有價值,但編碼起來並不令人愉快;不幸的是,如果你對它進行編碼,那麼你可能會發現自己正在閱讀很長的一段文字the PDF standard.
如果你確實寫了這樣的軟件,你可以考慮將它作爲開源發佈。
祝你好運。
謝謝,但我試圖購買這個軟件,我的經驗是可怕的。銷售人員花了幾天的時間甚至做出迴應,我被引用了網站上列出的兩次。顯然,他們對歐洲和美國的人們有不同的定價。 –
你爲什麼不在網上購物?銷售不經常處理這個產品,有時候會有混亂 – Tomato
我寫了一個使用Tesseract 3或Abbyy OCR 11的bash腳本。 它可以批量轉換或在目錄監視器模式下運行。
在你的情況
pmocr.sh --batch --target=PDF /path/to/tiff/files
在這裏看到的腳本: https://github.com/deajan/pmOCR
- 1. 批量轉換Omniform爲PDF /命令行
- 2. 在命令行將Mac iWork文件批量轉換爲PDF
- 3. 使用Linux命令行(FAX)將PDF轉換爲TIFF
- 4. 將PDF轉換爲TIFF
- 5. GnuWin32將tiff轉換爲pdf
- 6. wkhtmltopdf批量轉換CMD命令行
- 7. Linux命令行將PDF轉換爲excel
- 8. 從命令行將DOC轉換爲PDF
- 9. 轉換。使用命令行代碼轉換爲PDF
- 10. 批量轉換PDF到XPS
- 11. SWF到PDF批量轉換
- 12. 將PDF轉換爲圖像批量
- 13. Ghostscript將PDF轉換爲大型TIFF
- 14. 使用PDFClown將tiff轉換爲PDF
- 15. 使用的Ghostscript將PDF轉換爲TIFF
- 16. 庫DOC/XLS爲PDF/TIFF轉換
- 17. VB dLL將pdf轉換爲tiff
- 18. 將PDF轉換爲TIFF格式
- 19. Python將32位轉換爲16位tiff
- 20. 命令行:「 - 」轉換爲「U」
- 21. tiff中的顏色轉換爲PDF轉換
- 22. 將PDF和圖像文件轉換爲TIFF的批處理文件腳本
- 23. 轉換24Bit的8位TIFF
- 24. 將16位tiff文件轉換爲在線可見的東西?
- 25. 錯誤的TIFF文件轉換爲PDF文件
- 26. 將EMF文件轉換爲GDI命令的最佳軟件?
- 27. 使用powershell批量轉換docx到pdf
- 28. pdf到.tiff轉換使用java
- 29. 在osx上批量轉換.py(文本文件)爲.pdf
- 30. 我需要將DOC/TXT文件大批量轉換爲PDF
也許[這](http://www.moreno.marzolla.name/software/scan_to_pdf/)可以幫助 –
作爲我在我的問題中注意到,我已經編寫了一個使用tesseract和hocr2pdf進行轉換的程序。據我所知,hocr2pdf是能夠製作可轉位PDF文檔的唯一開源工具。你的鏈接沒有概述任何我不知道的東西,對不起。 –
這裏有兩個問題 - 完成OCR,然後轉換爲PDF。我想知道,如果您首先查看OCR TIFF到純文本,然後您可以使用類似'wkhtmltopdf'的東西將其轉換爲PDF後,該問題是否更容易搜索? – halfer