2012-09-07 60 views
1

我正在使用PDFBox,成功地從PDF中檢索字段座標。轉到多頁PDF文件,我遇到了這種情況,我需要確定這些字段來自哪個頁面,並且還需要將座標從下向上轉換爲從上向下。我已經閱讀了大量的文檔頁面以找到一種可行的方法,大多數返回null或失敗,並且在搜索時沒有結果。PDFBox,BBox,頁碼?

我在找什麼?文檔大綱? BBbos?媒體框?裁剪框?

而對於頁碼,其他一些庫只有getCurrentPageNo()這樣的標題方法。我需要:

List allPages = document.getDocumentCatalog().getAllPages(); 
    for (int i = 0; i < allPages.size(); i++) { 
    // etc for each one? 
} 

這是一個這樣的核心能力,我有點驚訝,我還沒有找到一個例子。

回答

1

明白了:

PDPage page = ......... 
PDRectangle mediaBox = page.getMediaBox(); 
System.out.println("Width:" + mediaBox.getWidth()); 
System.out.println("Height:" + mediaBox.getHeight()) 

的頁碼:

page.getCOSDictionary().equals(page)) 
+0

最後片段 「的頁號」 是錯誤的或不明確?謝謝! –

+0

是的,它證明是錯誤的,從不增加過去的第1頁。仍然沒有線索。 – jbrain

+0

您是否需要「真實」頁碼 - 頁面上打印的頁碼,可能是非數字 - 或者只是序號頁碼(1-n)? –