2016-08-26 115 views
0

我選擇了由Jacqueline Kazil和Katherine Karmul編寫的O'Reiley的Data Wrangling with Python。在第5章第94頁中,我運行以下代碼。意外的EOF,在Python上使用slate解析PDF文件2.7.12

import slate 

pdf = 'EN-FINAL Table 9.pdf' 

with open(pdf) as f: 
    doc = slate.PDF(f) 

for page in doc[:2]: 
    print page 

我使用的是Windows 10,巨蟒2.7.12,運行石板0.5.2,pdfminer 20140328和安裝成功的種子。我得到了以下結果:

File "C:\Python27\lib\site-packages\pdfminer\psparser.py", line 215, in fillbuf 
    raise PSEOF('Unexpected EOF') 
pdfminer.psparser.PSEOF: Unexpected EOF 

我只知道EOF手段「文件結尾」並沒有更多的數據可以從數據源中讀取。有誰知道發生了什麼?

如果有人想看看我試圖解析什麼文件,這是在這裏: https://github.com/jackiekazil/data-wrangling/tree/master/data/chp5

+0

爲什麼你會發布文字爲圖片(含有大量無關信息)? – Psytho

+0

嗨,亞歷克斯。我不明白你的意思。我正在閱讀本書中的教程,我應該能夠在安裝slate和pdfminer後運行此代碼。 – jjjack1

+0

您的錯誤代碼是文本,但您將它作爲整個顯示屏幕的屏幕截圖發佈。複製錯誤消息並將其作爲文本粘貼到此處。 – Psytho

回答

0

這解決了這個問題對我來說:https://stackoverflow.com/a/18262661/6843645

您的代碼將是:

import slate 

pdf = 'EN-FINAL Table 9.pdf' 
with open(pdf, 'rb') as f: 
    doc = slate.PDF(f) 

for page in doc[:2]: 
    print page 
+0

我試過這個,但我得到了ImportError:無法導入名稱PDFObjectNotFound。 – jjjack1