pypdf

    1熱度

    3回答

    我怎樣才能提取該流的一部分(一個名爲BLABLABLA)從包含它的PDF文件? <</Contents 583 0 R/CropBox[0 0 595.22 842]/MediaBox[0 0 595.22 842]/Parent 29 0 /Resources<</ColorSpace<</CS0 563 0 R>>/ExtGState<</GS0 568 0 R>>/Font<</TT0 55

    5熱度

    1回答

    上的PDF文件寫入XMP metadatas我可以通讀pyPdf XMP metadatas與此代碼: a = pyPdf.PdfFileReader(open(self.fileName)) b = a.getXmpMetadata() c = b.pdf_keywords ,但是:這是最好的辦法嗎? 如果我不使用pdf_keywords屬性? 有沒有什麼方法可以用pyPdf設

    5熱度

    4回答

    pyPdf是一個偉大的庫分裂,合併PDF文件。 我正在使用它將pdf文檔分成1頁文檔。 pyPdf是純粹的python,並且在保存提取頁面時,在PdfFileWriter對象的_sweepIndirectReferences()方法中花費了大量時間。我需要更好的表現。我試過使用多線程,但由於大部分時間都用在python代碼中,因爲GIL(它實際上運行速度較慢)沒有速度增益。 是否有任何用c編寫的庫