12
我想從PDF文件中提取所有文本框和文本框座標。如何從pdf文件中提取文本和文本座標?
許多其他StackOverflow文章解決了試圖以有序方式提取所有文本的各種解決方案,但花了相當長的一段時間才弄清楚如何執行獲取文本和文本位置的中間步驟。
所以一旦我找到它,我認爲這將是值得在這裏發佈。給定一個pdf文件,輸出應該如下所示:
489, 41, "Signature"
500, 52, "b"
630, 202, "a_g_i_r"