pypdf

    10熱度

    1回答

    我想使用pypdf創建/修改pdf文檔的標題。看來標題是隻讀的。有沒有辦法訪問這個元數據r/w? 如果答案是肯定的,一段代碼將不勝感激。 謝謝

    1熱度

    2回答

    在Ubuntu服務器上,我想創建包含其他靜態pdf的pdf。我試圖用pyPdf使用ReportLab。理想情況下,我會使用ReportLab來完成整個任務,但是爲了導入pdf,需要使用PageCatcher,它具有較高的週期性費用。 因此,我使用pyPdf合併使用ReportLab和我的其他pdfs創建的頁面。問題在於,儘管Acrobat和Foxit的外觀看起來很好,但其中一頁的一部分在Xerox

    6熱度

    4回答

    我寫了一個PDF合併器,它將原始文件與水印合並。 我現在要做的是在瀏覽器中通過Django視圖打開'document-output.pdf'文件。我已經檢查過Django的相關文章,但由於我的方法相對不同,我不直接創建PDF對象,使用響應對象作爲它的「文件」,所以我有點失落。 那麼,我該怎麼做是在Django視圖? from pyPdf import PdfFileWriter, PdfFileR

    2熱度

    2回答

    使用pypdf Python模塊如何閱讀下列PDF文件http://www.envis-icpe.com/pointcounterpointbook/Hindi_Book.pdf # -*- coding: utf-8 -*- from pyPdf import PdfFileWriter, PdfFileReader import pyPdf def getPDFContent(path

    20熱度

    3回答

    我有一些代碼從PDF文件閱讀。有沒有一種方法來讀取通過使用Pypdf,Python 2.6中的PDF文件(而不是網頁)行線,在Windows? 下面是用於讀取PDF頁面的代碼: import pyPdf def getPDFContent(path): content = "" num_pages = 10 p = file(path, "rb") pd

    5熱度

    4回答

    分割pdf 我想使用pyPdf根據大綱中的每個目標位置指向pdf中的不同頁面的大綱來分割pdf文件。 例如輪廓: main --> points to page 1 sect1 --> points to page 1 sect2 --> points to page 15 sect3 --> points to page 22 是pyPdf可輕鬆遍歷文件或

    5熱度

    1回答

    之間的空間目前,如果我有pyPdf PDF頁面的頁面對象,extractText(),什麼情況是,線路連接在一起。例如,如果頁面的第一行說「你好」和第2行說:「世界」所產生的文本從extractText()返回的是的「HelloWorld」,而不是「世界你好」。有誰知道如何解決這個問題,或者有解決方法的建議?我真正需要的文字有空格在字裏行間,因爲我對這個PDF文本做文本挖掘,而不是具有殺死它線之間

    4熱度

    3回答

    我想在Python中自動生成預訂確認PDF文件。大部分內容將是靜態的(即徽標,預訂條款,電話號碼),以及一些動態位(日期,費用等)。 從用戶方面來說,最簡單的方法是從PDF文件開始使用靜態內容,然後使用python來添加動態部分。這是一個簡單的過程嗎? 從做一些搜索,似乎我可以使用reportlab創建內容和pyPdf合併PDF的一起。這是最好的方法嗎?還是有一種非常時髦的方式,我還沒有遇到過呢?

    0熱度

    1回答

    我需要以編程方式將其他圖形元素添加到現有的靜態PDF書籍封面上。現在我使用pycairo繪製一個透明的PDFSurface,然後使用pyPdf將它合併到現有的靜態PDF中。這樣,PDFSurface就可以作爲覆蓋層。 但是,透明PDF與靜態PDF的TrimBox大小完全相同,因此比靜態PDF小。如何將內容定位在透明PDF上,以便在合併之後,它完全覆蓋靜態PDF的TrimBox?

    34熱度

    10回答

    如何從PDF文檔中提取所有圖像,並且以原始分辨率和格式? (意思是提取tiff作爲tiff,jpeg作爲jpeg等,並且不重新採樣)。佈局不重要,我不在乎源圖片是否位於頁面上。 我使用python 2.7,但如果需要可以使用3.x。