2012-05-20 72 views
4

我想讀取PDF文件並將文本存儲在文本文件中。但是,在做這件事時,我也想同時存儲字體信息。我知道PDFbox的文本stropping和fontbox的字體可以結合使用嗎?試圖將PDF轉換爲文本與字體

+0

你可能是一個在他們可能的解決方案上工作的人。 – OmniOwl

+0

如果'文本文件'是指'.txt'文件,請注意'純文本'文件不支持字體信息(除非用戶想讀取 - 但看不到 - 原始位於PDF中的字體名稱)。 –

+0

順便說一句 - 什麼是'fontbox'(請鏈接),'stropping'是什麼意思? –

回答

1

這應該是一個評論,但由於我得到的聲譽較低,我不能評論,所以我寫這裏。 我認爲你可以運行pdfbox和fontbox作爲2個線程(節省時間)。

保存您在Bean中獲取的數據,然後使用Bean獲取文本和字體信息。

您可能會解決您提取組合結果的問題。

+0

感謝人們發現了一個新的圖書館... –

+0

你可以與我們分享嗎? – JHS