是否可以使用PHP或Linux庫獲取PDF文檔中所有文本框的X/Y座標和高度/寬度?我正在使用PDFTK來提取PDF中的所有文本字段,但它不會提供座標和/或尺寸信息。如果不是,是否可以遍歷PDF文檔並計算文本字段的x,y和高度/寬度數據?獲取PDF中文本框的尺寸和座標
4
A
回答
0
這是可能的,但很難做到。
您可以使用FPDI在PHP中打開PDF文檔。它在內存中生成一個抽象的PDF對象樹。 TCPDF和FPDF可以將其保存回去。
但遍歷所述樹並找到正確的屬性是非常。 (我意外的動詞。)
現在PDF格式實際上是人類可讀的。它肯定會包含可讀格式的座標(它主要在點IIRC)。所以如果你只知道在哪裏尋找,你可能會用簡單的正則表達式來發現它。有些節點只需要進行gzuncompress()編輯,而不是試圖修改文檔或將其保存回去。所以,試試FPDI和print_r()來設計一個策略。
0
是的,這不是太難。我所知道的最好的工具是pdfminer。它是python,但如果你不想使用python,你可以將pdf信息轉換爲xml格式,然後用你選擇的武器解析它:)回覆如果你有麻煩:)
相關問題
- 1. Google腳本獲取PDF文檔尺寸
- 2. PDF獲取PDF尺寸
- 3. 如何從pdf文件中提取文本和文本座標?
- 4. PDF cropbox中的座標是指什麼尺寸?
- 5. 獲取文本的尺寸SFML
- 6. 獲取標籤中文本的座標
- 7. 硒:獲取座標或元素的尺寸與Python
- 8. 獲取從文本尺寸在JavaScript
- 9. 從目標c中的推文獲取文本和座標
- 10. PDF與文本和座標解析
- 11. Pdf文本座標/字體
- 12. Xarray:沒有尺寸的切片座標
- 13. 獲取TabControl的標題尺寸
- 14. PHP - 獲取HTML標籤的尺寸
- 15. 獲取RelativeLayout尺寸
- 16. 獲取SurfaceView尺寸
- 17. 獲取Quicktime尺寸
- 18. 獲取文本框中字符的座標?
- 19. 在textview中以座標獲取文本
- 20. PDF尺寸對實際內容尺寸
- 21. 使用xarray無座標下降尺寸
- 22. 平行座標:根據尺寸
- 23. 獲取Gtk標籤寬度尺寸
- 24. PHP獲取SWF文件的尺寸
- 25. 獲取視頻文件的尺寸
- 26. 獲取舞臺的尺寸
- 27. 獲取nswindow的尺寸
- 28. 如何在文本文件中獲取RGB值和座標值?
- 29. 如何獲取pdf文檔中的頁面座標onclick
- 30. jqgrid獲取標題和標題高度尺寸