pdftotext

    1熱度

    1回答

    我有一個python腳本在其中不斷拍擊: subprocess.call(["pdftotext", pdf_filename]) 錯誤之中: OSError: [Errno 2] No such file or directory 絕對指向文件名的路徑(我在調試時將其存儲在日誌文件中)很好;在命令行上,如果我鍵入pdftotext <pdf_filename_goes_here>它適用於

    1熱度

    1回答

    我想用Python來運行pdftotext,但由於某種原因,我的代碼不工作。如果我運行下面的內容,我期望內容變量將包含PDF的內容,但是我得到的結果只是一個空字符串。 有人知道我錯過了什麼嗎? def getPDFContent(path): path = "/path/to/a valid/pdffile.pdf" process = subprocess.Popen(["

    2熱度

    2回答

    任何人都可以幫助從PDF頁面中提取文本? <?php $pdf = Zend_Pdf::load('example.pdf'); $page = $pdf->page[0]; 我會假設頁面方法會存在,但我找不到任何東西讓我提取內容。 例如:$ page-> getContents(); $ PAGE->的toString(); $ PAGE-> extractText(); ...幫助!!

    2熱度

    1回答

    我正在轉換我的Ruby項目中的pdf文件。我正在使用PDF工具包gem。 文檔顯示瞭如何使用pdftotext pdftotext(文件,OUTFILE =零,&塊) 在我的項目,我轉換爲PDF文件不帶任何參數,可以只是這樣做: PDF :: Toolkit.pdftotext( 「file.pdf」,「file.txt的) 如果我在命令行中運行它,我可以通過傳遞PARAM pdftotext -