我正在寫代碼來格式化PDF,它是由專有程序自動生成的。我已經開發了以下代碼來完成以下目標:javascript adobe字詞沒有顯示在「this.getPageNthWord」
- 翻閱每頁的前10個單詞。如果單詞「評估」和「摘要」按順序顯示,請刪除該頁面和文檔末尾之間的每個頁面。
在一些文件上它可以很好地工作,但是在其他文件上,任務不會刪除最終頁面。當我運行this.getPageNthWord(「有評估摘要的頁面索引」,「評估索引」)時,它會跳過該單詞。
我的第一個想法是,我在屏幕上看到的單詞是一個圖像文件,但是當我編輯PDF或使用Ctrl + F搜索時,它顯示爲文本。似乎後端軟件正在生成數據並將其放置在大部分空白的模板上,javascript this.getPageNthWord函數只計算由後端軟件生成的數據,而不是模板。
我的問題是如何在PDF文件中的單詞不顯示在this.getPageNthWord?有沒有其他的屬性可以被找到?
for (var p=this.numPages-1; p>=0; p--) {
for (var n=0; n<10; n++) {
if (this.getPageNthWord(p, n) == "Evaluations") {
if (this.getPageNthWord(p, n+1) == "Summary") {
for (var d=p; d<this.numPages;d++){
this.deletePages(d)
}
}
}
}
}