0
我想以編程方式解析PDF文件,查找特定短語並找出每個短語所在的頁碼。這是可能的(我知道pdf不像文本文件)?是的,有圖書館可以幫助嗎?解析PDF和識別頁面上的短語
我想以編程方式解析PDF文件,查找特定短語並找出每個短語所在的頁碼。這是可能的(我知道pdf不像文本文件)?是的,有圖書館可以幫助嗎?解析PDF和識別頁面上的短語
Apache Tika,您可以在Apache Lucene project找到,它包含PDFBox,它將提取可以使用它的文本。
您正在嘗試使用哪種語言和平臺? – mauris 2009-12-30 03:18:30