2012-03-09 72 views
1

有誰知道acrobat reader如何知道我目前正在查看的頁面? 例如 - 我有一個PDF文件,其中包含頁腳中的頁碼,格式爲1/A或1/1 - 分爲章節,acrobat知道這是頁碼 - 它不會只寫入從開始頁的總頁數到當前頁面。頁腳寫在頁腳

我正在編寫C#應用程序,WinForms,我需要獲取頁面的數量 - 就像雜技演員一樣。 我將每個頁面轉換爲pdfLibView庫文本,但是,然後,我需要看最後一頁,並使用複雜的算法找出頁腳中的哪個字符串是頁碼 - 它可以包含任何其他信息。

因此,任何想法,如何獲得格式的頁碼,因爲它寫在這個頁面上?

回答

1

看起來您的文檔使用PDF規範中定義的頁面標籤功能。

8.3.1頁面​​標籤說:

此外,文檔可以選擇定義頁面的標籤(PDF 1.3),以 視覺識別屏幕上或打印每一頁。頁面標籤和頁面索引不必重合:索引是固定的,連續地從第一頁的0開始運行 , ,但標籤可以以適合 特定文檔的任何方式指定。例如,如果文檔以羅馬數字編號的前置物的12頁 開頭,並且 文檔的其餘部分以阿拉伯文編號,則第一頁將具有0的頁索引 和頁面標籤i,第十二頁面將有指數11和 標籤第十二和第十三頁會有12指數和標籤1.

如果您要訪問的網頁時可能會嘗試Docotic.Pdf library現有文檔中的標籤信息(免責聲明:我工作圖書館的供應商)。

這是add Page Labels to PDF document的示例。此示例不顯示如何訪問現有標籤,但可能會提供一些啓動線索。