如何檢測,損壞的pdf(使用python)?檢測並刪除損壞的PDF
我有很多pdf。其中一些pdf已經損壞,應該刪除。我如何檢測和刪除?
我用:
from pyPdf import PdfFileReader
try :
mypdf = PdfFileReader(file('sample.pdf', 'rb'))
except:
print ' is invalid pdf'
但如何自動從文件中讀取PDF文件,並刪除損壞的PDF文件?
如何檢測,損壞的pdf(使用python)?檢測並刪除損壞的PDF
我有很多pdf。其中一些pdf已經損壞,應該刪除。我如何檢測和刪除?
我用:
from pyPdf import PdfFileReader
try :
mypdf = PdfFileReader(file('sample.pdf', 'rb'))
except:
print ' is invalid pdf'
但如何自動從文件中讀取PDF文件,並刪除損壞的PDF文件?
Adobe Reader實際上包含了很多自動修復功能,因此它會打開很多損壞的PDF文件。
是的,當然,但下載的PDF文件不完整,無法修復。 –
然後只檢查它在最後1024個字節中有%% EOF –
我該如何檢查? –
請您澄清「損壞的PDF」術語的含義,Adobe Reader是否無法讀取? –
是的,沒有打開它 –
損壞pdf文件 –