1
有誰知道如何通過多頁PDF搜索某些文本(例如,發票號碼),然後將該頁面提取到單獨的文件?我看到如何使用FPDI來提取特定頁面,然後使用FPDF進行修改和保存。我無法弄清楚的部分是如何搜索pdf並確定文本所在的頁碼。這最好用php來完成,但如果有必要,我會願意使用其他的東西。搜索pdf和提取頁面時發現
有什麼建議嗎?
謝謝。
有誰知道如何通過多頁PDF搜索某些文本(例如,發票號碼),然後將該頁面提取到單獨的文件?我看到如何使用FPDI來提取特定頁面,然後使用FPDF進行修改和保存。我無法弄清楚的部分是如何搜索pdf並確定文本所在的頁碼。這最好用php來完成,但如果有必要,我會願意使用其他的東西。搜索pdf和提取頁面時發現
有什麼建議嗎?
謝謝。
此頁幫我找到了一個解決方案:
http://www.freak-search.com/en/thread/2817957/find_page_number_containing_a_given_text
基本上,您使用的命令行程序「pdftotext」在bash腳本(見鏈接)返回頁碼,然後FPDI到提取頁面。很棒。