pypdf

1熱度

3回答

我怎樣才能提取該流的一部分（一個名爲BLABLABLA）從包含它的PDF文件？ <</Contents 583 0 R/CropBox[0 0 595.22 842]/MediaBox[0 0 595.22 842]/Parent 29 0 /Resources<</ColorSpace<</CS0 563 0 R>>/ExtGState<</GS0 568 0 R>>/Font<</TT0 55

5熱度

1回答

讀/通過pypdf

上的PDF文件寫入XMP metadatas我可以通讀pyPdf XMP metadatas與此代碼： a = pyPdf.PdfFileReader(open(self.fileName)) b = a.getXmpMetadata() c = b.pdf_keywords ，但是：這是最好的辦法嗎？如果我不使用pdf_keywords屬性？有沒有什麼方法可以用pyPdf設

5熱度

4回答

快速PDF分割器庫

pyPdf是一個偉大的庫分裂，合併PDF文件。我正在使用它將pdf文檔分成1頁文檔。 pyPdf是純粹的python，並且在保存提取頁面時，在PdfFileWriter對象的_sweepIndirectReferences（）方法中花費了大量時間。我需要更好的表現。我試過使用多線程，但由於大部分時間都用在python代碼中，因爲GIL（它實際上運行速度較慢）沒有速度增益。是否有任何用c編寫的庫