pypdf2

    1熱度

    1回答

    我一直在嘗試大約一個星期來自動從pdf中提取圖像。不幸的是,我在這裏找到的答案沒有任何幫助。我使用pypdf2在相同的代碼中看到了多個變體,全部都是['/XObject'],這導致了KeyError。 我正在尋找的東西似乎隱藏在流中,我在pypdf2的字典中找不到(即使在遞歸探索整個結構之後,在我能找到的每個間接對象上調用.getObject())。 使用pypdf2我已經寫了一頁pdf並打開它使

    0熱度

    1回答

    我正在使用PyPDF2處理多個pdf文件,但我的腳本掛在某處。我在控制檯中看到的是一些「startxref與offset偏移量相同的行」,我正確的是一個警告,所以它仍然應該到finally塊並返回一個空字符串。 我做錯了什麼? import PyPDF2 import sys import os def decode_pdf(src_filename): out_str=""

    1熱度

    1回答

    這是How to insert a "missing" page as blank page in PDF with Python?的重寫,但我試圖使用PdfFileWriter其他方法:cloneDocumentFromReader()和addBlankPage(),因爲它看起來更清晰。 我需要在PDF的末尾添加一個空白頁,如果它包含奇數頁,但頁面數大於1 所以我想這樣做: from PyPDF

    -1熱度

    3回答

    我寫了一些代碼來讀取「pdf」文件的特定頁面中的數據,並使用python將其寫入csv文件。它只是部分工作。但是,將數據寫入csv文件時,它會將這些數據寫入一行而不是常規模式。我應該如何修改腳本以達到目的?提前致謝。 這是我到目前爲止已經試過: import csv from PyPDF2 import PdfFileReader outfile = open("conversion.csv

    2熱度

    1回答

    我正在檢查文件系統中的損壞的PDF。在我正在運行的測試中,有近200k PDF。看起來好像更小的損壞的文件警報正確,但我碰到一個大的15 MB文件損壞,代碼只能無限期地掛起。我試過將Strict設置爲False而沒有運氣。這似乎是最初的問題。而不是做線程和設置超時(我曾嘗試在過去很少成功),我希望有一個替代方案。 import PyPDF2, os from time import gmtime

    0熱度

    1回答

    基於https://programtalk.com/python-examples/PyPDF2.PdfFileWriter/,示例2,我嘗試將附件添加到PDF文件中。 這裏是我的代碼,我試圖運行: import os import PyPDF2 from django.conf import settings ... doc = os.path.join(settings.BASE_

    0熱度

    2回答

    我想將元數據鍵值對添加到pdf文件的元數據中。 我發現了一個幾歲的答案,但我認爲這是複雜的方式。我想今天有一個更簡單的方法:https://stackoverflow.com/a/3257340/633961 我沒有與pypdf2結婚,如果有一個更簡單的方法,那麼我走這條路?

    0熱度

    1回答

    我想根據他們所在的縣來生成pdf文件。如果每個縣有多個pdf文件,那麼我需要根據縣域密鑰將文件附加到單個文件中。我似乎無法獲得基於密鑰追加的地圖。生成的最終地圖看起來是隨機的,往往會附加太多的文件。我很確定我沒有正確分組它們。我已經讀過一個鍵中的多個值可能導致多次顯示。有人可以告訴我如何分別訪問每個鍵的每個值,只有一次?很顯然,我不瞭解某些至關重要的事情。 我的代碼: import csv, os

    1熱度

    1回答

    我嘗試在Python 3中使用PyPDF2模塊,但我無法顯示'頁面大小'屬性。 我想知道在掃描到PDF文件之前紙張尺寸是多少。 事情是這樣的: import PyPDF2 pdf=PdfFileReader("sample.pdf","rb") print(pdf.getNumPages()) 但是我正在尋找另一個Python函數,而不是例如getNumPages()... 下面這個命令打

    0熱度

    1回答

    當我使用下面的代碼 from PyPDF2 import PdfFileMerger merge = PdfFileMerger() for newFile in nlst: merge.append(newFile) merge.write('newFile.pdf') 出事瞭如下: raise utils.PdfReadError("EOF marke