2011-06-06 43 views
2

我正在構建一個應用程序,通過瀏覽器查看pdf,而不需要移動設備上的插件。我試過ImageMagick和ghostscript將頁面轉換爲圖像,但它們太大而文字變得不清晰。我看到網站提供了將PDF轉換爲html並執行下降工作的服務,但是我找不到如何完成這個工作的例子。任何幫助深表感謝。謝謝!PDF to HTML或同級

+0

老問題,但:您可以聯繫您提及的在線服務,並詢問他們是如何做到的。有些人不會說,但嘗試沒有任何傷害。 – halfer 2012-04-24 19:11:00

回答

1

編輯:我似乎已經讀過這個問題。在這種情況下,最好通過PDF進行解析,然後根據所找到的格式對HTML進行格式化。我相信javapdf選項能夠做到這一點,但我沒有使用任何這些,所以我不確定。如果情況變得更糟,並且您無法找到反彙編PDF的軟件,那麼您可以通過閱讀PDF規範來使用Java或PHP編寫自己的反彙編程序。祝你好運!

http://www.adobe.com/devnet/pdf/pdf_reference.html - PDF規範(的Adobe修改後的版本,因爲他們是最流行的,你可能想支持他們擴展)

- 老 - 這些網站可能會寫自己的專有軟件做的伎倆。如果您對這項工作真正感興趣,我會建議解析HTML以獲取數據和樣式信息,並使用它來格式化某些PDF編寫器API。快速谷歌搜索將產生以下: - END OLD -

http://www.cutepdf.com/Solutions/

http://ruby-pdf.rubyforge.org/pdf-writer/doc/index.html

http://asprise.com/product/javapdf/

+0

我想你可能誤解了這個問題,我的意思是我想在不需要插件的情況下將PDF轉換爲瀏覽器中的可見格式。從我所收集的鏈接中,您提供的所有內容都是創建pdf。無論如何感謝您的光臨。 – Tw1tCh 2011-06-06 15:20:27

+0

你說得對,我似乎已經向後看了這個問題。其中一些軟件也可能包含PDF閱讀功能。在這種情況下,你會做與我之前所說的相反的內容,閱讀PDF並使用讀者提供的信息格式化一些HTML。我非常確定javapdf選項可以做到這一點。 – CuddleBunny 2011-06-13 18:45:27

1

如果您正在尋找在PDF轉換爲HTML和規劃上運行一個轉換服務器,那麼你可以嘗試pdf2html。它是作爲poppler-utils的一部分打包的程序。我不知道該程序如何完成它。

+0

感謝您的提示,我之前已經使用過這個項目,並且它的確工作得很好,儘管我希望在設備上本地完成這項工作。 – Tw1tCh 2012-08-08 00:34:44