2012-02-20 105 views
2

我想將僅包含文本的pdf文件轉換爲html格式。 我想檢索內容(文本,格式,縮進等),並將其存儲在變量中,以相同的格式,排列和縮進顯示。將PDF轉換爲PHP中的HTML庫

任何人都可以推薦一個PHP類/庫(不是軟件工具,不需要安裝),我可以使用嗎?

感謝

回答

1

pdf2text給你正是它說:它從PDF文件中提取文本,它不會將其轉換爲HTML標記。您可能需要使用命令行實用程序或此服務的在線服務。

有Linux命令行pdftohtml工具

Poppler是另一種選擇,它含有一種叫pdftohtml

效用或者如果你prepred考慮一個Java應用程序

還有一個有jPedal我會猜你想要「免費」

+0

我沒有使用它們,我只是意識到它們的存在......所以我不能真正評論它們有多好,或者如何使用它們 – 2012-02-20 09:29:53

0

你可以使用FPDI-PDF-Parser(COMERCIAL)來導入你的pdf文件les或FPDI(免費)導入像PDF模板(你不能修改免費版本的文本)。或者您可以存儲一些HTML格式的模板和簡碼,並使用TCPDF創建新的PDF:開源PHP類。

+0

我猜FPDI在生成PDF而不是閱讀它。我想要的是讀取pdf文件的內容(文本)並將其存儲在一個php變量中,並以pdf格式顯示相同的格式(粗體,斜體,縮進等)。 – 2012-02-21 02:31:18