2013-06-26 27 views
2

我得到這個錯誤「No/Root object! - 這真的是PDF嗎?」使用我的MAC電腦與Python 2.7和PDFMiner版本20110515. PDF文件沒有損壞,因爲具有相同文件的相同程序在我的PC上運行!此外,我已經嘗試了很多PDF文件,並且所有這些錯誤都存在。任何想法,我應該改變我的MAC不會得到這個錯誤?Python PDFMiner error:「No/Root object! - 這真的是PDF嗎?」

+1

版本PDFMiner的20110515是一個Beta版本,所以它可能有錯誤。幸運的是它是純粹的Python,它可以幫助調試變得更容易。你所描述的問題可能是由於在解析文件中處理行尾的方式。確保它們以二進制模式打開,即'fp = open('mypdf.pdf','rb')'。在問題文件上運行附帶的'dumppdf.py'工具也可能會有所幫助。最後,錯誤可能是由於Python解釋器因機器而異。通用換行支持不適用於所有版本的Python。 – martineau

回答

2

我找到了問題的根源:

我不得不讀目錄中的所有文件,並分析它們的方法。事實證明,我在該目錄中有一個不是pdf文件的隱藏文件!

這裏是我固定的問題:

for filename in os.listdir(INPUT_DIR_NAME): 
    if filename.endswith('.pdf'): 
     #do stuff!