2016-07-25 14 views
1

我試圖使用PyPDF2從pdf打印文本。這裏是我的代碼:PyPDF2不打印文本中的任何輸出

import PyPDF2 
pdf_file = open('report.pdf', 'rb') 
read_pdf = PyPDF2.PdfFileReader(pdf_file) 
number_of_pages = read_pdf.getNumPages() 
page = read_pdf.getPage(1) 
page_content = page.extractText() 
print (page_content.encode('utf-8')) 

結果我得到一些警告的空行。

PdfReadWarning: Xref table not zero-indexed. ID numbers for objects will be corrected. [pdf.py:1736] 
b'' 

我檢查了這個警告本身並沒有影響結果,但在我的情況下我什麼都沒有。有什麼建議麼。由於

回答

0

試着改變你這樣的代碼:

import PyPDF2 
pdf_file = open('report.pdf', 'rb') 
read_pdf = PyPDF2.PdfFileReader(pdf_file) 
number_of_pages = read_pdf.getNumPages() 
page_content = read_pdf.getPage(1).extractText() 
print (page_content.encode('utf-8','strict'))