我期待根據當前頁面文本將父級PDF分割爲子PDF。如果第x頁包含文本「ABC」,那麼我會分割該PDF。但是,帶分隔符的代碼從PDF的第1頁開始。基於頁面內容分割的選擇性PDF
String currentPageText = PdfTextExtractor.getTextFromPage(reader, page, strategy);
if (currentPageText.contains(searchText))
{
System.out.println("Current page"+page);
splitter.split(new FileOutputStream("H:/Work/PDFs/Purchase & Sale Activity____" + page + ".pdf"), 200000);
}
更改問題以反映您想要提取頁面,而不是拆分文檔。 –
Goutham,我理解你對@Joris的回答是否正確,你是否真的想用ABC替換一個頁面兩個頁面,一個內容最多ABC,一個內容跟隨ABC,然後拆分文檔這些頁面對之間? – mkl
如果頁面(例如:頁面3)的10頁PDF格式中包含「ABC」文本,則只有第3頁應該是目標位置的新PDF。 – Goutham