2013-06-12 138 views
-1

如何檢測,損壞的pdf(使用python)?檢測並刪除損壞的PDF

我有很多pdf。其中一些pdf已經損壞,應該刪除。我如何檢測和刪除?

我用:

from pyPdf import PdfFileReader 

try : 
    mypdf = PdfFileReader(file('sample.pdf', 'rb')) 
except: 
    print ' is invalid pdf' 

但如何自動從文件中讀取PDF文件,並刪除損壞的PDF文件?

+0

請您澄清「損壞的PDF」術語的含義,Adobe Reader是否無法讀取? –

+0

是的,沒有打開它 –

+0

損壞pdf文件 –

回答

1

Adob​​e Reader實際上包含了很多自動修復功能,因此它會打開很多損壞的PDF文件。

+0

是的,當然,但下載的PDF文件不完整,無法修復。 –

+0

然後只檢查它在最後1024個字節中有%% EOF –

+0

我該如何檢查? –