2011-12-07 121 views
0

有什麼辦法可以將PDF轉換爲HTML嗎?我需要文件中的文本,當我嘗試使用PDFtoText庫時,我得到了文本,但未排序,沒有任何解析規則。 我注意到,一些PDFtoHTML在線服務對於該文件非常有效。那麼,請提供任何提示? Here is the PDF file和我只需要在右列中的一個特定的行。在PHP中將特定的PDF文件轉換爲HTML

+0

http://stackoverflow.com/questions/956508/convert-pdf-to-html –

+0

你應該試試這個答案:http://stackoverflow.com/a/ 2249962/765854,並只採取你關心的部分。 –

回答

0

嘗試整合poppler項目中的PDFtoHTML;應該支持表格識別。

0

pdftohtml工作正常:快速,穩定但html結果最好是醜陋的。我已經用了很長一段時間爲一個有很多工作簡歷的網站。

然而,這是提取文本內容的好方法。

我會給scribd API試試

http://www.scribd.com/developers/api

或谷歌應用程序文件API。 GOogle做了一個很棒的工作顯示和轉換PDF文件

+0

來源:stackoverflow.com/questions/956508/convert-pdf-to-html –