1
嗨,我的工作對解析出PDF數據上觀看移動設備的應用程序,我正在尋找一種方法,通過特定文本PDF文件進行掃描和獲取的x & y座標該文本塊。這甚至是可能的。我在一臺Linux服務器上工作,用php,但我很靈活地使用任何方法來實現這個工作。謝謝。PDF解析特定文本
嗨,我的工作對解析出PDF數據上觀看移動設備的應用程序,我正在尋找一種方法,通過特定文本PDF文件進行掃描和獲取的x & y座標該文本塊。這甚至是可能的。我在一臺Linux服務器上工作,用php,但我很靈活地使用任何方法來實現這個工作。謝謝。PDF解析特定文本
商業選擇:
所有都相當成熟,TET是非常具體的文本提取, pdfToolbox是一個通用的SDK,用於分析和處理PDF(但具有用於文本提取的特定功能,頁面上具有文本座標),而Adobe PDF Library是一種通用開發工具(提供大量低級功能,但代碼將不得不被寫入,確實找到文本/文字/字符並拉出座標)。
聲明:我卡拉斯軟件的工作,我對pdfToolbox看法可能會有所偏差。