我正在用PHP直接從PDF文件中提取低級圖像,因爲GhostScript太慢了,而且我做得很好。但問題是,我無法弄清楚它說圖像屬於哪個頁面的地方。我從PDF中獲取圖像沒有問題,但我無法弄清楚它們的順序。如何知道PDF規範中圖像屬於哪個頁面?
在PDF數據中的哪個位置表示圖像應顯示在哪個頁面上?
我正在用PHP直接從PDF文件中提取低級圖像,因爲GhostScript太慢了,而且我做得很好。但問題是,我無法弄清楚它說圖像屬於哪個頁面的地方。我從PDF中獲取圖像沒有問題,但我無法弄清楚它們的順序。如何知道PDF規範中圖像屬於哪個頁面?
在PDF數據中的哪個位置表示圖像應顯示在哪個頁面上?
圖像作爲獨立對象存儲在PDF中。它們通過頁面的資源字典XObject子字典從頁面引用。關係是頁面 - >資源 - >圖像,所以爲了知道圖像屬於哪個頁面,您必須掃描所有頁面的所有資源字典,並查看您的圖像出現在哪些資源字典中。圖像可以從多個資源字典中引用。這是非常低級別的PDF操作,我不知道你的代碼工作水平有多低。
如果你可以分享你在做的細節,我們可以幫助 – aWebDeveloper
我從PDF中提取圖像...用記事本+ +打開PDF,你會看到它的樣子。 – Alasdair
搜索分頁符,但你做什麼可能是不對的 – aWebDeveloper