我試圖從網頁獲取PDF,解析並使用PyPDF2將結果打印到屏幕上。我懂了沒有問題的工作與下面的代碼:Python 3從網絡解析PDF
with open("foo.pdf", "wb") as f:
f.write(requests.get(buildurl(jornal, date, page)).content)
pdfFileObj = open('foo.pdf', "rb")
pdf_reader = PyPDF2.PdfFileReader(pdfFileObj)
page_obj = pdf_reader.getPage(0)
print(page_obj.extractText())
中寫入一個文件,這樣我就可以讀它雖然聽起來浪費了,所以我想我只是削減這個中間人:
pdf_reader = PyPDF2.PdfFileReader(requests.get(buildurl(jornal, date, page)).content)
page_obj = pdf_reader.getPage(0)
print(page_obj.extractText())
然而,這讓我產生了一個AttributeError: 'bytes' object has no attribute 'seek'
。我如何將來自requests
的PDF直接送入PyPDF2?
對不起,我忘了提及我需要Python3兼容 –