2012-04-18 52 views
0

解決此問題的最佳方法是使用「xpdf」包中的「pdftotext」,但在所有共享主機中,我googled shell_exec被禁用。我發現替代的metod只使用php,就像一個名爲pdf2string()(在php.net上)的函數,但沒有一個函數沒有按預期工作(有些pdf文件只是沒有輸出正確的文本和其他pdf他們沒有輸出任何東西,而這個函數的其他版本根本沒有工作,所以我排除了這個選項)。任何方式將該開源pdftotext轉換爲一個PHP腳本? (源於C++我認爲,可以在這裏找到:http://www.foolabs.com/xpdf/download.html)。任何其他解決方案將被接受,只要它給我的PDF文本輸出(正確的)在pdf中將pdf轉換爲文本文件(注意:shell_exec已禁用)

+0

可能最好的解決方案是找出爲什麼你嘗試過的PHP庫不起作用。你應該指定你使用過的以及每個過程發生了什麼。更有可能的是,你將能夠找到一個知道他們如何工作以及如何解決你的問題的人,而不是你會發現某人想要在PHP中重新實現pdftotext ... – octern 2012-04-18 22:43:23

+0

@octern我不知道變化很大pdf(和即時消息不inteIn),所以我不知道他們爲什麼沒有工作 – 2012-04-18 22:45:14

+0

找到一個更好的主機。 – 2012-04-18 23:12:03

回答

3

由於你有一個有限的環境,你可能想看看這個。 http://webcheatsheet.com/php/reading_clean_text_from_pdf.php

這不使用外部庫將pdf解析爲文本格式。 但是,由於這個解析原始PDF格式的文本,我不知道它有多穩定。

+0

我看了一下這個網站3個looooong之夜,最後我沒有任何可以解決我的問題。該功能部分工作,但不是一些pdf文件 – 2012-04-18 22:50:35

+0

正如我所說,我不太確定該代碼是多麼穩定。你的服務器是否支持popen類功能(我懷疑)?這將成爲pdf2text的另一種方式。 – 2012-04-18 22:55:29

+0

不,它不支持既不popen() – 2012-04-18 23:02:59