2011-03-28 73 views
0

我使用apache pdfbox 1.5從pdf中提取文本。這是正在使用的code。這對於某些pdf似乎工作正常。但是對於一個pdf,出現以下錯誤失敗。讓我知道,如果一個人遇到這樣的問題&解決apache pdfbox問題java.lang.IndexOutOfBoundsException:索引:2,大小:2

java.lang.IndexOutOfBoundsException: Index: 2,Size: 2 at java.util.SubList.rangeCheck(AbstractList.java:864) at java.util.SubList.get(AbstractList.java:737) at org.apache.fontbox.cff.CharStringConverter.drawCurve(CharStringConverter.java:415) at org.apache.fontbox.cff.CharStringConverter.handleType2Command(CharStringConverter.java:277) at org.apache.fontbox.cff.CharStringConverter.handleCommand(CharStringConverter.java:81) at org.apache.fontbox.cff.CharStringHandler.handleSequence(CharStringHandler.java:53) at org.apache.fontbox.cff.CharStringConverter.handleType2Command(CharStringConverter.java:307) at org.apache.fontbox.cff.CharStringConverter.handleCommand(CharStringConverter.java:81) at org.apache.fontbox.cff.CharStringHandler.handleSequence(CharStringHandler.java:53) at org.apache.fontbox.cff.CharStringConverter.convert(CharStringConverter.java:64) at org.apache.fontbox.cff.CFFFont$Mapping.toType1Sequence(CFFFont.java:374) at org.apache.fontbox.cff.AFMFormatter.renderFont(AFMFormatter.java:126) at org.apache.fontbox.cff.AFMFormatter.printFontMetrics(AFMFormatter.java:64) at org.apache.fontbox.cff.AFMFormatter.printFont(AFMFormatter.java:57) at org.apache.fontbox.cff.AFMFormatter.format(AFMFormatter.java:50)

+0

此問題已解決?我在同一時間被困住了......謝謝。 – 2012-08-16 22:17:58

回答

0

是否有可能分享其創造該問題的PDF文件?

此外,請檢查command line version是否與啓用-force選項一起使用。

+0

嗨Nikhil,我已經上傳了pdf [here](http://cid-a3aa7f7d9888874d.office.live.com/self.aspx/Public/getting%5E_started%5E_with%5E_Flex3.pdf)。讓我知道你是否能夠提取文本 – dazzle 2011-03-29 06:43:18

+0

對不起,似乎沒有工作。我也在這個文件上嘗試過[icePDF](http://www.icepdf.org/),但那也無法提取文本。 – nikhil500 2011-03-30 06:32:43

+0

好的,謝謝Nikhil的幫助!現在我已經向Apache提出了一個jira問題。讓我們看看他們有什麼話要說。 – dazzle 2011-03-30 07:28:42

相關問題