我想使用java應用程序將PDF文件轉換爲html文件。該PDF文件包含一些圖像,文字等沒有人知道一個好的Java API? (請不要建議Aspose)。 我試過的Apache PDFBox的,但並不滿足將PDF轉換爲HTML文件Java API
回答
退房
JPedal,它處理嵌入字體非常好,但不是免費的。
IcePDF,它是免費的,但它只能提取文本/圖像或呈現PDF圖像。
public class QHyperArticleHtmlBuilder extends QHtmlBuilder {
QStyle anchorStyle = createStyle("anchorStyle", a);
QStyle sectionStyle = createStyle("sectionStyle", div);
QStyle subsectionStyle = createStyle("subsectionStyle", div);
...
public String buildSubSectionHeading(String anchorName, String text) {
return buildAnchorHeading(subsectionStyle, anchorName, text);
}
protected String buildAnchorHeading(QStyle divStyle,
String anchorName, String text) {
QMutableElement element = create(p);
element.add(br);
element.add(create(a, anchorStyle, name.create(anchorName)))
.add(create(div, divStyle, text));
return element.buildHtml();
}
public String buildLink(String url, String label) {
QMutableElement element = create(a, anchorStyle, href.create(url));
element.add(create(span, underlineStyle))
.add(create(span, linkStyle, label));
return element.buildHtml();
}
}
pre.javaStyle {
font-family: courier new, courier, mono;
background-color: #fbfbfb;
font-size: 11pt;
width: 800px;
border: dashed 1px;
border-color: lightgray;
padding-left: 4px;
}
資源here
感謝您的回覆。我想要一個開源的API(不支付)。我不會考慮aspose api,因爲它不是免費的。 – user3505725
@ user3505725你是否已經找到一個好的選擇? – qgicup
CSSBox Pdf2Dom是一個Java庫,允許(除其他事項外),PDF轉換爲HTML。該發行版甚至包含基於此庫的PDFToHTML命令行工具,以便您可以檢查結果是否符合您的需求。但是,如上所述,將PDF轉換爲HTML總是非常棘手。結果取決於特定PDF文件的複雜性和結構,因此不同的工具可能適用於不同的PDF文件。
您可以嘗試使用Print2Flash:www.print2flash.com它可以從Java轉換爲HTML,不僅包括PDF文檔,還包括其他類型的文檔:Office文檔,AutoCAD圖形等。它解決了我們所有文檔發佈需求公司網站。
也許你可以使用這個API:https://market.mashape.com/netservice/convert-pdf-to-html 作品對於Java,節點,PHP等..
而不是發佈鏈接作爲答案添加一些文本來解釋這個答案如何幫助OP在修復當前issue.Thanks –
試試我們稱爲jPDFWeb Java庫,保存字體和圖像分辨率從原來的PDF。您可以上傳自己的PDF並嘗試現場演示。
- 1. 將html文件轉換爲PDF文件?
- 2. 轉換HTML文件爲PDF使用Java
- 3. API用於將文件轉換爲PDF
- 4. 將HTML文件轉換爲PDF
- 5. PHP:將html文件轉換爲pdf
- 6. 將HTML轉換爲PDF文件
- 7. 將HTML文件轉換爲PDF
- 8. 如何使用Java將HTML網頁轉換爲PDF文件
- 9. 使用java將文件轉換爲PDF
- 10. 將任何文件類型轉換爲使用Java API的pdf
- 11. 使用Java將HTML文件轉換爲PDF
- 12. 如何將HTML文件轉換爲Java中的PDF?
- 13. 將.jrxml文件轉換爲.pdf文件
- 14. codeigniter - 將html轉換爲pdf
- 15. ASP.NET將HTML轉換爲PDF
- 16. 將html轉換爲pdf codeigniter
- 17. 將PDF轉換爲HTML
- 18. c#將pdf轉換爲html
- 19. 將PDF轉換爲HTML
- 20. Rails:將HTML轉換爲PDF?
- 21. 如何將HTML轉換爲PDF文檔
- 22. 將大型HTML文檔轉換爲PDF
- 23. 將文檔轉換爲html和pdf
- 24. 在PDF中將PDF文件轉換爲HTML#
- 25. Evo Pdf不將HTML轉換爲PDF
- 26. 在PDF中將PDF轉換爲HTML?
- 27. 如何將html轉換爲pdf與PDF?
- 28. 轉換HTML內容爲PDF文件
- 29. 將文檔轉換爲pdf
- 30. 將TEX文件轉換爲PDF或DOCX?
我不能提出一個庫,但一些普遍性的建議:PDF到HTML是不平凡的。它們是兩種非常不同的格式,任何轉換都將很大程度上取決於PDF的質量和結構。單獨以正確的順序提取文本可能會很棘手。更別說格式和佈局。通常手動對話將是最好的實際解決方案。可能是更大的圖片將有助於提供更詳細的幫助:多少PDF?你自己做了嗎?或一般:你爲什麼需要這樣做? – RoToRa