我想讀取PDF文件並將文本存儲在文本文件中。但是,在做這件事時,我也想同時存儲字體信息。我知道PDFbox的文本stropping和fontbox的字體可以結合使用嗎?試圖將PDF轉換爲文本與字體
4
A
回答
1
這應該是一個評論,但由於我得到的聲譽較低,我不能評論,所以我寫這裏。 我認爲你可以運行pdfbox和fontbox作爲2個線程(節省時間)。
保存您在Bean中獲取的數據,然後使用Bean獲取文本和字體信息。
您可能會解決您提取組合結果的問題。
+0
感謝人們發現了一個新的圖書館... –
+0
你可以與我們分享嗎? – JHS
相關問題
- 1. 將文本轉換爲PDF
- 2. 將pdf轉換爲文本
- 3. 試圖將動態NSString文本轉換爲粗體文本
- 4. 將Windows窗體轉換爲pdf文件
- 5. 將文本文件轉換爲pdf
- 6. 將office文件轉換爲pdf與documents4J
- 7. 使用PDFSharp將PDF轉換爲文本
- 8. PDFBox的0.7.3將PDF轉換爲文本
- 9. 在PHP中將文本轉換爲PDF
- 10. 使用perl將pdf轉換爲文本
- 11. 將PDF轉換爲字節
- 12. 將字節[]轉換爲PDF
- 13. 將PDF轉換爲圖像
- 14. 將jpeg圖片轉換爲pdf文件
- 15. pdfbox將圖像轉換爲pdf文件
- 16. 如何將html轉換爲pdf與PDF?
- 17. 將文檔轉換爲pdf
- 18. 將彩色文本從HTML轉換爲DOCBOOK(並轉換爲PDF)
- 19. 將文本文件轉換爲PDF轉換代碼將文本截斷vb.net
- 20. 如何將cairo-pdf轉換爲eps,而無需將字體轉換爲輪廓
- 21. 當轉換爲PCL時,ghostscript將pdf中的文本轉換爲圖形
- 22. 如何將文本圖像轉換爲字轉換器?
- 23. 將Unicode實體轉換爲Unicode文本
- 24. 將html實體轉換爲文本
- 25. 如何將PDF轉換爲不帶文本的圖像
- 26. 將閃存圖轉換爲圖像/ pdf
- 27. pdf文字轉換
- 28. 試圖將字符串轉換爲MarketDataIncrementalRefresh
- 29. 通過PHP將HTML轉換爲PDF(爲html2pdf安裝字體)
- 30. 將數字字符實體引用轉換爲可讀文本
你可能是一個在他們可能的解決方案上工作的人。 – OmniOwl
如果'文本文件'是指'.txt'文件,請注意'純文本'文件不支持字體信息(除非用戶想讀取 - 但看不到 - 原始位於PDF中的字體名稱)。 –
順便說一句 - 什麼是'fontbox'(請鏈接),'stropping'是什麼意思? –