pdftotext

1熱度

1回答

我有一個python腳本在其中不斷拍擊： subprocess.call(["pdftotext", pdf_filename]) 錯誤之中： OSError: [Errno 2] No such file or directory 絕對指向文件名的路徑（我在調試時將其存儲在日誌文件中）很好;在命令行上，如果我鍵入pdftotext <pdf_filename_goes_here>它適用於

1熱度

1回答

子過程不輸出任何東西

我想用Python來運行pdftotext，但由於某種原因，我的代碼不工作。如果我運行下面的內容，我期望內容變量將包含PDF的內容，但是我得到的結果只是一個空字符串。有人知道我錯過了什麼嗎？ def getPDFContent(path): path = "/path/to/a valid/pdffile.pdf" process = subprocess.Popen(["

2熱度

2回答

如何從pdf頁面使用Zend_Pdf提取文本

任何人都可以幫助從PDF頁面中提取文本？ <?php $pdf = Zend_Pdf::load('example.pdf'); $page = $pdf->page[0]; 我會假設頁面方法會存在，但我找不到任何東西讓我提取內容。例如：$ page-> getContents（）; $ PAGE->的toString（）; $ PAGE-> extractText（）; ...幫助!!

2熱度

1回答

Ruby PDF：使用pdftotext的工具包

我正在轉換我的Ruby項目中的pdf文件。我正在使用PDF工具包gem。文檔顯示瞭如何使用pdftotext pdftotext（文件，OUTFILE =零，&塊）在我的項目，我轉換爲PDF文件不帶任何參數，可以只是這樣做： PDF :: Toolkit.pdftotext（「file.pdf」，「file.txt的）如果我在命令行中運行它，我可以通過傳遞PARAM pdftotext -