2014-04-07 226 views
10

我想使用java應用程序將PDF文件轉換爲html文件。該PDF文件包含一些圖像,文字等沒有人知道一個好的Java API? (請不要建議Aspose)。 我試過的Apache PDFBox的,但並不滿足將PDF轉換爲HTML文件Java API

+2

我不能提出一個庫,但一些普遍性的建議:PDF到HTML是不平凡的。它們是兩種非常不同的格式,任何轉換都將很大程度上取決於PDF的質量和結構。單獨以正確的順序提取文本可能會很棘手。更別說格式和佈局。通常手動對話將是最好的實際解決方案。可能是更大的圖片將有助於提供更詳細的幫助:多少PDF?你自己做了嗎?或一般:你爲什麼需要這樣做? – RoToRa

回答

1

退房

JPedal,它處理嵌入字體非常好,但不是免費的。

IcePDF,它是免費的,但它只能提取文本/圖像或呈現PDF圖像。

public class QHyperArticleHtmlBuilder extends QHtmlBuilder { 
    QStyle anchorStyle = createStyle("anchorStyle", a); 
    QStyle sectionStyle = createStyle("sectionStyle", div); 
    QStyle subsectionStyle = createStyle("subsectionStyle", div); 
    ...  
    public String buildSubSectionHeading(String anchorName, String text) { 
     return buildAnchorHeading(subsectionStyle, anchorName, text); 
    } 

    protected String buildAnchorHeading(QStyle divStyle, 
      String anchorName, String text) { 
     QMutableElement element = create(p); 
     element.add(br); 
     element.add(create(a, anchorStyle, name.create(anchorName))) 
     .add(create(div, divStyle, text)); 
     return element.buildHtml(); 
    } 

    public String buildLink(String url, String label) { 
     QMutableElement element = create(a, anchorStyle, href.create(url)); 
     element.add(create(span, underlineStyle)) 
     .add(create(span, linkStyle, label)); 
     return element.buildHtml(); 
    } 
} 


pre.javaStyle { 
    font-family: courier new, courier, mono; 
    background-color: #fbfbfb; 
    font-size: 11pt; 
    width: 800px; 
    border: dashed 1px; 
    border-color: lightgray; 
    padding-left: 4px; 
} 

資源here

+0

感謝您的回覆。我想要一個開源的API(不支付)。我不會考慮aspose api,因爲它不是免費的。 – user3505725

+0

@ user3505725你是否已經找到一個好的選擇? – qgicup

6

CSSBox Pdf2Dom是一個Java庫,允許(除其他事項外),PDF轉換爲HTML。該發行版甚至包含基於此庫的PDFToHTML命令行工具,以便您可以檢查結果是否符合您的需求。但是,如上所述,將PDF轉換爲HTML總是非常棘手。結果取決於特定PDF文件的複雜性和結構,因此不同的工具可能適用於不同的PDF文件。

0

您可以嘗試使用Print2Flash:www.print2flash.com它可以從Java轉換爲HTML,不僅包括PDF文檔,還包括其他類型的文檔:Office文檔,AutoCAD圖形等。它解決了我們所有文檔發佈需求公司網站。

0

試試我們稱爲jPDFWeb Java庫,保存字體和圖像分辨率從原來的PDF。您可以上傳自己的PDF並嘗試現場演示。

https://www.qoppa.com/pdfhtml/