pypdf

10熱度

1回答

我想使用pypdf創建/修改pdf文檔的標題。看來標題是隻讀的。有沒有辦法訪問這個元數據r/w？如果答案是肯定的，一段代碼將不勝感激。謝謝

1熱度

2回答

在Ubuntu服務器上，我想創建包含其他靜態pdf的pdf。我試圖用pyPdf使用ReportLab。理想情況下，我會使用ReportLab來完成整個任務，但是爲了導入pdf，需要使用PageCatcher，它具有較高的週期性費用。因此，我使用pyPdf合併使用ReportLab和我的其他pdfs創建的頁面。問題在於，儘管Acrobat和Foxit的外觀看起來很好，但其中一頁的一部分在Xerox

6熱度

4回答

如何在瀏覽器中打開生成的PDF文件？

我寫了一個PDF合併器，它將原始文件與水印合並。我現在要做的是在瀏覽器中通過Django視圖打開'document-output.pdf'文件。我已經檢查過Django的相關文章，但由於我的方法相對不同，我不直接創建PDF對象，使用響應對象作爲它的「文件」，所以我有點失落。那麼，我該怎麼做是在Django視圖？ from pyPdf import PdfFileWriter, PdfFileR

2熱度

2回答

pypdf蟒蛇工具

使用pypdf Python模塊如何閱讀下列PDF文件http://www.envis-icpe.com/pointcounterpointbook/Hindi_Book.pdf # -*- coding: utf-8 -*- from pyPdf import PdfFileWriter, PdfFileReader import pyPdf def getPDFContent(path

20熱度

3回答

如何通過線PDF文件使用PyPdf讀取行？

我有一些代碼從PDF文件閱讀。有沒有一種方法來讀取通過使用Pypdf，Python 2.6中的PDF文件（而不是網頁）行線，在Windows？下面是用於讀取PDF頁面的代碼： import pyPdf def getPDFContent(path): content = "" num_pages = 10 p = file(path, "rb") pd

5熱度

4回答

根據大綱

分割pdf 我想使用pyPdf根據大綱中的每個目標位置指向pdf中的不同頁面的大綱來分割pdf文件。例如輪廓： main --> points to page 1 sect1 --> points to page 1 sect2 --> points to page 15 sect3 --> points to page 22 是pyPdf可輕鬆遍歷文件或

5熱度

1回答

Python和pyPdf - 如何從網頁中提取文本，以便有行

之間的空間目前，如果我有pyPdf PDF頁面的頁面對象，extractText（），什麼情況是，線路連接在一起。例如，如果頁面的第一行說「你好」和第2行說：「世界」所產生的文本從extractText（）返回的是的「HelloWorld」，而不是「世界你好」。有誰知道如何解決這個問題，或者有解決方法的建議？我真正需要的文字有空格在字裏行間，因爲我對這個PDF文本做文本挖掘，而不是具有殺死它線之間

4熱度

3回答

在Python中生成和合並PDF文件

我想在Python中自動生成預訂確認PDF文件。大部分內容將是靜態的（即徽標，預訂條款，電話號碼），以及一些動態位（日期，費用等）。從用戶方面來說，最簡單的方法是從PDF文件開始使用靜態內容，然後使用python來添加動態部分。這是一個簡單的過程嗎？從做一些搜索，似乎我可以使用reportlab創建內容和pyPdf合併PDF的一起。這是最好的方法嗎？還是有一種非常時髦的方式，我還沒有遇到過呢？

0熱度

1回答

使用Cairo和pyPDF爲一個合併對齊兩個PDF

我需要以編程方式將其他圖形元素添加到現有的靜態PDF書籍封面上。現在我使用pycairo繪製一個透明的PDFSurface，然後使用pyPdf將它合併到現有的靜態PDF中。這樣，PDFSurface就可以作爲覆蓋層。但是，透明PDF與靜態PDF的TrimBox大小完全相同，因此比靜態PDF小。如何將內容定位在透明PDF上，以便在合併之後，它完全覆蓋靜態PDF的TrimBox？

34熱度

10回答

從python中提取圖像而不重新採樣，在python中？

如何從PDF文檔中提取所有圖像，並且以原始分辨率和格式？（意思是提取tiff作爲tiff，jpeg作爲jpeg等，並且不重新採樣）。佈局不重要，我不在乎源圖片是否位於頁面上。我使用python 2.7，但如果需要可以使用3.x。