我有PDF文件,其中包含水平對齊,垂直對齊和反向對齊等四種不同方向的文本。使用PDFBox API從pdf中讀取文本時,我獲得了良好的水平對齊文本輸出,但在其他情況下卻沒有。 例如,如果「斜體」單詞水平對齊,則輸出爲「斜體」。如果它是垂直對齊的,那麼輸出在整個行上分割,如「 」it a
li c「(這裏」it「,」a「,」li「,」c「在不同的行中)。 我想知道是否有任何方法可以獲得良好的輸出,即使是垂直和反向對齊的文本。如何使用PDFBox API從PDF獲取文本的方向
4
A
回答
2
相關問題
- 1. 如何使用Apache PDFBox從PDF文件中提取文本
- 2. 如何使用pdfbox從pdf中提取粗體文本?
- 3. 如何使用java和PDFBox從PDF獲取字符的Unicode
- 4. 使用pdfbox獲取pdf文本的字體屬性
- 5. 使用PDFBOX從PDF
- 6. 使用pdfbox從PDF文件中提取文本
- 7. 如何使用PDFBOX從PDF表單獲取當前頁碼?
- 8. 如何使用pdfbox獲取PDF表單文本字段的內容?
- 9. 使用PDFBox 2.0從PDF中提取文本
- 10. 使用PDFBox 2.0.2從PDF中提取文本缺失類PDFTextStripper()
- 11. 使用PDFBox獲取文本顏色
- 12. 使用PDFBox v2從PDF中提取TIFF
- 13. 使用pdfbox從PDF中提取圖像
- 14. 如何使用Java(不使用pdfbox)從pdf中提取圖像
- 15. 無法使用PDFBOX讀取PDF文件
- 16. 如何使用PDFBox獲取PDF表單中字段的類型
- 17. 使用PDFBox替換PDF文本
- 18. 創建文本PDF(PDFBox的?)
- 19. 如何使用CAM :: PDF在PDF頁面中獲取文本字符串的文本方向?
- 20. 如何從PDF頁面獲取文本?
- 21. 使用PDFBox從PDF獲取可見簽名?
- 22. Android-從PDF獲取文本
- 23. PDF文本方向
- 24. 如何使用PDFBox從HTML創建PDF文件?
- 25. 如何使用PDFBOX
- 26. 如何使用PdfBox創建pdf包?
- 27. 用於pdf創建的pdfbox:如何進行文本佈局?
- 28. 如何用PDFBox替換PDF中的居中文本
- 29. 使用PDFBOX API創建一個新的PDF文檔
- 30. 從NSString的pdf中獲取文本
很抱歉,您不會共享一個示例PDF。雖然有垂直書寫的PDF字體,但我認爲PDF中的字體不是那種類型。如果我的假設是正確的,那麼「*垂直對齊*」文本實際上由橫跨多行的正常水平對齊文本組成。因此,輸出*分割爲「它是一個 李c」*將是正確的。 – mkl
但是,如果我的假設是錯誤的,PDFBox仍然不會提取文本,因爲它是在考慮水平文本的情況下實現的。但是,在這種情況下,你可能會相應地重寫'org.apache.pdfbox.text.PDFTextStripper.writePage()'。 – mkl
您可以請分享您使用的代碼,因爲我面臨類似的問題。 –