我指的是「https://github.com/keensoft/alfresco-simple-ocr」在tiff和jpeg文件上執行OCR,但是會顯示「找不到拖車字典」,「無法讀取外部參照表」,「異常失敗(「錯誤:pdfinfo無法確定頁數,請檢查pdf輸入文件。\ n」)「儘管從jpeg或tiff文件轉換爲PDF文件可以正常工作,並且PDF文件在alfresco共享頁面上可見」但沒有OCR正在處理這些tiff和jpeg文件無法在tiff和jpeg文件上執行OCR
0
A
回答
1
基本上有很多工具用於在pdf文件上執行OCR。它也取決於該工具。在露天存在一個錯誤。它是一個庫下面是詳細說明。
創建一個名爲transformation.sh的文件,在添加命令之前,您必須在其中添加下面一行。如果您使用的是Windows,則需要相應地創建批處理文件。
未設置LD_LIBRARY_PATH
如果您沒有在腳本文件上面的設置,你將面對一個錯誤,而conversation.You可以找到下面的露天註冊問題alfresco.Its的鏈接,錯誤的詳細信息。
https://issues.alfresco.com/jira/browse/ALF-19946
PDF到PDF的談話是很好的鏈接如下解釋英寸
http://www.krutikjayswal.com/2016/07/ocr-on-pdf-file-in-alfresco.html
您可能需要修改源代碼TIFF交談。
相關問題
- 1. Jpeg from Tiff(jpeg-compressed)
- 2. 我可以在JPEG文件上停止OCR嗎?
- 3. OCR批處理tiff到文本
- 4. 使用Python從TIFF和JPEG-2000文件讀取JHOVE屬性?
- 5. 無法在Qt中導入jpeg文件
- 6. 將JPEG-In-Tiff轉換爲普通TIff
- 7. silverstripe上傳tiff並轉換爲jpeg
- 8. 無法執行.mp3文件
- 9. 無法執行jar文件
- 10. 無法執行.jar文件
- 11. 無法執行./sh文件
- 12. 無法執行omnet ++文件
- 13. 無法執行java文件
- 14. 「無法在System.Decimal和System.String上執行」Like「。
- 15. jpeg和tiff像素值提取
- 16. 無法讀取TIFF圖像文件
- 17. OpenIMAJ庫無法讀取tiff文件?
- 18. IPreviewHandler和TIFF文件
- 19. 無法在Linux上運行Pyinstaller可執行文件
- 20. 無法在.Net Framework 2.0上運行我的可執行文件
- 21. 無法在java中執行文件IO
- 22. 閱讀TIFF和DICOM圖像無損JPEG壓縮
- 23. 在Google文檔中的圖像上執行OCR
- 24. 如何創建可通過tesseract OCR讀取的TIFF文件?
- 25. 無法上傳尺寸爲5MB或更大的tiff文件
- 26. Qt-無法保存jpeg文件
- 27. libtiff.net無法讀取jpeg壓縮文件
- 28. 在java中將jpeg/png轉換爲tiff
- 29. Unix可執行文件無法在MAC OSX中執行
- 30. 無法執行「喜歡」上System.Decimal和System.String
嗨。你也可以看看我的項目(https://github.com/bchevallereau/alfresco-tesseract)。它基於Tesseract。 –