5
A
回答
0
據我所知,它是而不是可能使用PHP在運行中將PDF轉換爲可編輯的HTML,同時保留格式。有大量的桌面應用程序,所有嘗試從PDF中提取數據有時更多,有時不太可靠的結果。我會說目前這不是現實可行的,你所能做的就是使用XPDF或其他命令行工具來提取純文本。
它可能不同於那個基於XML的新PDF格式,但我還沒有真正瞭解這一點。
隨意證明我錯了,當然 - 如果有解決方案,我會非常感興趣。
1
看一看XPDF
我想你可以在編輯器中顯示它做
$text = shell_exec("pdftotext $pdffile");
作爲?那麼,哪位編輯? 要保留某種類型的格式信息,並假設您使用的是Web編輯器,則表示HTML編輯器,您可以將其轉換爲HTML。也許有其他工具可用,但由於我使用xpdf,我遇到了基於xpdf的this轉換器。
基本用法
pdftohtml -noframes -c test.pdf test.html
爲了得到它到你喜歡的編輯器
echo file_get_contents('test.html');
您可能需要包裝內的PHP函數/類的東西。你可能想要添加安全措施和什麼。
相關問題
- 1. 從PDF中提取所有內容
- 2. 從PDF中提取文本內容
- 3. 使用Adobe API提取PDF內容
- 4. 使用PHP從PDF中籤名提取
- 5. 使用PHP從.pdf中提取頁面
- 6. 無法使用tika從pdf文件中提取文本內容
- 7. 用PHP提取內容從標籤
- 8. PHP - 從分支中提取內容
- 9. 使用jsoup從表中提取內容
- 10. 使用php提取xml文件集中的內容使用php
- 11. 使用php從大型內容中提取文本
- 12. 如何使用PHP從HTML中提取特定內容?
- 13. 從LOGSTASH讀取PDF內容
- 14. 從pdf中獲取html內容url(jsoup)
- 15. Phonegap從PDF文件中獲取內容
- 16. Apache Tika無法從大型PDF中提取全文內容
- 17. 如何從PDF中提取指定的內容
- 18. 從PDF雜誌中提取文章內容
- 19. 有沒有什麼辦法從bash中提取pdf的內容?
- 20. 使用JSOUP提取內容
- 21. 提取內容:使用XPath
- 22. 使用PDFBox v2從PDF中提取TIFF
- 23. 使用pdfbox從PDF中提取圖像
- 24. 從PDF中提取表格使用Tabula
- 25. 使用C從PDF中提取圖像#
- 26. 從最內括號中提取內容?
- 27. 到PDF轉換提取HTML內容,並給予選項使用PHP
- 28. Php - 上傳文檔,docx,pdf - 提取所有內容
- 29. 使用PHP從PDF文件中提取頁面
- 30. 如何使用PHP從PDF文件中提取文本?
任何在線自定義開發的網站編輯器。 – jose