2011-06-07 56 views
1

嗨,我的工作對解析出PDF數據上觀看移動設備的應用程序,我正在尋找一種方法,通過特定文本PDF文件進行掃描和獲取的x & y座標該文本塊。這甚至是可能的。我在一臺Linux服務器上工作,用php,但我很靈活地使用任何方法來實現這個工作。謝謝。PDF解析特定文本

回答

3

商業選擇:

  • TET(文本提取工具包)從http://www.pdflib.com SDK;可用於測試機制的Acrobat插件
  • pdfToolbox SDK http://www.callassoftware.com;交互式桌面版可用於測試
  • 如果你準備做一些更多的編碼自己:需要Adobe PDF庫,SDK,可通過Datalogics

所有都相當成熟,TET是非常具體的文本提取, pdfToolbox是一個通用的SDK,用於分析和處理PDF(但具有用於文本提取的特定功能,頁面上具有文本座標),而Adobe PDF Library是一種通用開發工具(提供大量低級功能,但代碼將不得不被寫入,確實找到文本/文字/字符並拉出座標)。

聲明:我卡拉斯軟件的工作,我對pdfToolbox看法可能會有所偏差。