2011-08-04 77 views

回答

14

這是不正確的方式來提取字體。要閱讀的字體一個具有通過PDF頁面和下面摘錄的字體迭代:

PDDocument doc = PDDocument.load("C:/mydoc3.pdf"); 
List<PDPage> pages = doc.getDocumentCatalog().getAllPages(); 
for(PDPage page:pages){ 
    Map<String,PDFont> pageFonts=page.getResources().getFonts(); 
} 
0
import org.apache.pdfbox.pdmodel.PDDocument; 
import org.apache.pdfbox.util.PDFTextStripper; 
public class pdf2box { 
    public static void main(String args[]) 
    { 
     try 
     { 
    PDDocument pddDocument=PDDocument.load("table2.pdf"); 
    PDFTextStripper textStripper=new PDFTextStripper(); 
    System.out.println(textStripper.getText(pddDocument)); 
    textStripper.getFonts(); 



    pddDocument.close(); 
     } 
     catch(Exception ex) 
     { 
     ex.printStackTrace(); 
     } 
    } 


} 
+2

這給了我一個空的地圖,而Harpreet的答案給了我預期的輸出 – bcoughlan

+0

PDFTextStripper在pdfBox 2.04中沒有'getFonts()'方法。 –

相關問題