2010-05-21 160 views
1

我想閱讀原始內容像它的字體(它可能是一些字體大小,而一些字體大小很大),段落和表格,如果是的話。閱讀原始內容的PDF文件

如何可能。

plz help。

回答

1

您想要一個庫,如jPod,它可以將PDF文檔解析回它們生成的結構。 PDF規範非常複雜,但如果您只是想要刮擦文本,或者是一兩個字體,那麼這不應該太難。

+0

嗨 是否有可能閱讀doc文件與原始內容....像段落和字體大小,字體顏色和表? – kalpesh 2010-05-21 10:06:45

+0

除非PDF是作爲結構化內容創建的,否則這不在文件中 - 它需要被猜測。我寫了一篇博客文章,解釋PDF中的內容:http://pdf.jpedal.org/java-pdf-blog/bid/12670/PDF-text – 2010-05-21 18:40:34