Python新的Python。 我正在使用此代碼來提取文本。是否可以提取所有頁面並在文件中輸出?從PDF中提取文本 - 所有頁面和輸出 - 使用Python的文件
import PyPDF2
pdf_file = open('sample.pdf','rb')
read_pdf = PyPDF2.PdfFileReader(pdf_file)
number_of_pages = read_pdf.getNumPages()
page = read_pdf.getPage(10)
page_content = page.extractText()
print (page_content)
我覺得你可以參考此鏈接http://stackoverflow.com/questions/17003185/extracting-entire-pdf-data-with-python-pdfminer/39736947#39736947除了pypdf2 – mikewolfli