2013-12-19 80 views
2

我有一個包含佔位符的事情,比如姓名,公司等,他們都在格式文本替換PDF文檔中使用javascript

< <「NAME」 >>或< <「公司」某些PDF模板>>

目前我公司的流程是在獲取信息時手動替換所有這些佔位符。我試圖通過從CSV文件中獲取信息並僅對佔位符進行查找和替換來自動執行此過程。但是,我唯一的文件是inDesign文件和PDF的模板。我看着inDesign文件,並據我可以告訴他們是可執行的,不可能讀入。

我希望有人知道一種方式來閱讀PDF文件來做一個正則表達式來替換佔位符文本。

+1

看看這個類似的話題:http://stackoverflow.com/questions/220445/how-to-program-a-text-search-and-replace-in-pdf-files –

回答

-1

如果您想要閱讀PDF文件並對其執行regular expression操作,那麼您可以通過以下方式執行此操作。

我建議PDFTestStream閱讀PDF文件。

PDFTextStreamS text = new PDFTextStream(file); 


    int pageCount = text.getPageCnt(); 
      try { 
       for (int i = 0; i < pageCount; i++) { 

        Page singlePage = text.getPage(i); 
        singlePage.pipe(tgt); 

        int noOfParagraphs = getNoOfParagraphs(singlePage); 

        /* Do for each paragraph in a page */ 
        for (int j = 0; j < noOfParagraphs; j++) { 

         Block block = singlePage.getTextContent().getChild(j); 

         List<Line> lines = block.getLines(); 

         /* Create line texts for each line */ 
         Level HeadingLevel = new Level(); 
         for (int lineNumber = 0; lineNumber < lines.size(); lineNumber++) { 
          Line line = lines.get(lineNumber); 
          StringBuilder lineText = new StringBuilder(1024); 
          OutputTarget lineTgt = new OutputTarget(lineText); 
          line.pipe(lineTgt); 
          /** Apply Regex here **/ 
          lineText.toString().matches("<<'"+your_search+word+"'>>"); 
        .... 
       } 
    } 
} 
+0

JavaScript是不是與Java相同! – Hoffmann