我有一個巨大的pdf文件(20 MB/800頁),其中包含一些信息。用於從java讀取巨大.pdf文件的最佳API
它有索引超鏈接。其餘大部分信息均以表格格式(pdf格式)。我需要使用Java檢索這些信息並將其存儲在SQL Server中。
哪個是可用於從Java讀取此類文件的最佳API?
我有一個巨大的pdf文件(20 MB/800頁),其中包含一些信息。用於從java讀取巨大.pdf文件的最佳API
它有索引超鏈接。其餘大部分信息均以表格格式(pdf格式)。我需要使用Java檢索這些信息並將其存儲在SQL Server中。
哪個是可用於從Java讀取此類文件的最佳API?
這是不太可能在PDF中的表格格式爲PDF不包含結構信息n除非在創建時明確添加。我寫了一篇文章,解釋了從PDF提取文本的一些問題:http://www.jpedal.org/PDFblog/2009/04/pdf-text/
確實iText失敗? – Nishant 2011-02-09 05:13:27