解決此問題的最佳方法是使用「xpdf」包中的「pdftotext」,但在所有共享主機中,我googled shell_exec被禁用。我發現替代的metod只使用php,就像一個名爲pdf2string()(在php.net上)的函數,但沒有一個函數沒有按預期工作(有些pdf文件只是沒有輸出正確的文本和其他pdf他們沒有輸出任何東西,而這個函數的其他版本根本沒有工作,所以我排除了這個選項)。任何方式將該開源pdftotext轉換爲一個PHP腳本? (源於C++我認爲,可以在這裏找到:http://www.foolabs.com/xpdf/download.html)。任何其他解決方案將被接受,只要它給我的PDF文本輸出(正確的)在pdf中將pdf轉換爲文本文件(注意:shell_exec已禁用)
回答
由於你有一個有限的環境,你可能想看看這個。 http://webcheatsheet.com/php/reading_clean_text_from_pdf.php
這不使用外部庫將pdf解析爲文本格式。 但是,由於這個解析原始PDF格式的文本,我不知道它有多穩定。
我看了一下這個網站3個looooong之夜,最後我沒有任何可以解決我的問題。該功能部分工作,但不是一些pdf文件 – 2012-04-18 22:50:35
正如我所說,我不太確定該代碼是多麼穩定。你的服務器是否支持popen類功能(我懷疑)?這將成爲pdf2text的另一種方式。 – 2012-04-18 22:55:29
不,它不支持既不popen() – 2012-04-18 23:02:59
- 1. 將文本文件轉換爲pdf
- 2. 將文本轉換爲PDF
- 3. 將pdf轉換爲文本
- 4. 在PHP中將文本轉換爲PDF
- 5. 將html文件轉換爲PDF文件?
- 6. 將.jrxml文件轉換爲.pdf文件
- 7. 使用PDFSharp將PDF轉換爲文本
- 8. 使用perl將pdf轉換爲文本
- 9. 上傳PDF文件轉換爲文本
- 10. 將pdf文件轉換爲word文檔
- 11. 使用java將文件轉換爲PDF
- 12. API用於將文件轉換爲PDF
- 13. getBlob()正在將文件轉換爲pdf
- 14. 將文檔轉換爲pdf
- 15. 在PDF中將PDF文件轉換爲HTML#
- 16. 將文本文件轉換爲PDF轉換代碼將文本截斷vb.net
- 17. PDFBox的0.7.3將PDF轉換爲文本
- 18. 將pdf文件轉換爲文本文件
- 19. PDF格式轉換爲文本「無法打開文件pdf」
- 20. 如何使用itext liberary將pdf轉換爲文本文件
- 21. 如何將PDF轉換爲iPhone中的文本文件?
- 22. 如何將PDF轉換爲iTextSharp中的文本文件
- 23. 將PDF文檔(* .pdf)轉儲到文本?
- 24. 將xml文件轉換爲pdf c#
- 25. 將HTML文件轉換爲PDF
- 26. 將pdf轉換爲word doc文件
- 27. PHP:將html文件轉換爲pdf
- 28. 如何將gp4文件轉換爲pdf
- 29. codeigniter將excel文件轉換爲pdf
- 30. 如何將.CATDrawing文件轉換爲.pdf
可能最好的解決方案是找出爲什麼你嘗試過的PHP庫不起作用。你應該指定你使用過的以及每個過程發生了什麼。更有可能的是,你將能夠找到一個知道他們如何工作以及如何解決你的問題的人,而不是你會發現某人想要在PHP中重新實現pdftotext ... – octern 2012-04-18 22:43:23
@octern我不知道變化很大pdf(和即時消息不inteIn),所以我不知道他們爲什麼沒有工作 – 2012-04-18 22:45:14
找到一個更好的主機。 – 2012-04-18 23:12:03