2
A
回答
4
文本文件本身不能包含格式。
您不能在純文本文件中保留格式,因爲它只包含文本。文本文件中可能會有HTML標記,但我會將其稱爲HTML文件。否則,您應該嘗試將其轉換爲富文本格式(RTF),Microsoft Word,OpenOffice或其他文檔類型。
1
PDFBox的將幫助你這一點,可能會失去一些格式爲埃裏克·羅伯遜說
參考PDF Text Parser: Converting PDF to Text in Java using PDFBox
1
這可以幫助你。
File f = new File(fileName);
if (!f.isFile()) {
return null;
}
try {
parser = new PDFParser(new FileInputStream(f));
} catch (Exception e) {
return null;
}
try {
parser.parse();
cosDoc = parser.getDocument();
pdfStripper = new PDFTextStripper();
/* pdfStripper.setStartPage(2);
pdfStripper.setEndPage(3);*/
pdDoc = new PDDocument(cosDoc);
parsedText = pdfStripper.getText(pdDoc);
} catch (Exception e) {
System.out.println("An exception occured in parsing the PDF Document.");
e.printStackTrace();
try {
if (cosDoc != null) cosDoc.close();
if (pdDoc != null) pdDoc.close();
} catch (Exception e1) {
e.printStackTrace();
}
return null;
}
相關問題
- 1. Ghostscript的轉換PDF文本,並保持PDF文件表格式
- 2. 將PDF轉換爲文本 - 保留表格的行 - Python
- 3. PDF格式轉換爲文本「無法打開文件pdf」
- 4. 使用iText將PDF格式轉換爲PDF格式(保留數據)
- 5. 將文本文件轉換爲pdf
- 6. 將文本轉換爲PDF
- 7. 將pdf轉換爲文本
- 8. 將文檔轉換爲PDF格式
- 9. 將DOCX轉換爲PDF格式的PDF
- 10. 如何將gp4文件轉換爲pdf
- 11. 如何將.CATDrawing文件轉換爲.pdf
- 12. 如何將DJVU文件轉換爲PDF
- 13. 如何將網頁轉換爲PDF格式,如PDF格式保存爲PDF格式打印
- 14. 如何將大圖片PDF文件轉換爲PNG格式?
- 15. asp.net itextsharp將文件格式文件轉換爲PDF
- 16. 將html文件轉換爲PDF文件?
- 17. 將.jrxml文件轉換爲.pdf文件
- 18. 將彩色文本從HTML轉換爲DOCBOOK(並轉換爲PDF)
- 19. 上傳PDF文件轉換爲文本
- 20. 如何以編程方式將PDF文件轉換爲文本文件?
- 21. 如何使用itext liberary將pdf轉換爲文本文件
- 22. 如何將PDF轉換爲iPhone中的文本文件?
- 23. 如何將PDF轉換爲iTextSharp中的文本文件
- 24. MS-Office文檔轉換爲.PDF格式
- 25. 將pdf文件轉換爲word文檔
- 26. 如何使用Wicked PDF將圖像文件轉換爲PDF?
- 27. 如何使用SVG圖形將PDF轉換爲PDF文件?
- 28. 如何將非PDF網址轉換爲.pdf文件?
- 29. 將PDF轉換爲基於XML的文件格式並保留佈局和樣式的最佳工具
- 30. 將文檔轉換爲pdf
爲什麼要這樣做?也許你錯了...... – 2012-01-05 13:07:28