2011-09-21 61 views
0

好的!因爲這個,我的灰色毛髮開始冒出來。解析許多文件並將數據提取到新文件?

我有400個PDF文件,我想從中提取一行。該行以DIR開頭,然後是一個數字。但我還需要文件名稱!

所以有人知道通過PDF解析的方法(或者我可以將它們轉換爲txt),然後搜索一個術語,展開,追加文件名並將其保存到一個新文件中。

任何幫助將不勝感激!

感謝,

托爾

+0

你告訴你可以轉換PDF文件到TXT嗎?如果是這樣,請發佈該文件的示例並更好地解釋您需要的內容。我們會幫你 – Marco

+0

如果你需要將PDF文件轉換爲TXT,你可以試試[this](http://www.somepdf.com/some-pdf-to-txt-converter.html):它似乎是免費的30天... – Marco

回答

0

你有的iText庫,您可以使用用於打開PDF文件。 比你需要掃描每個PDF爲你的模式 鏈接到圖書館www.itextpdf.com

相關問題