我試圖運行pdftotext
使用python subprocess
模塊。Python子進程調用xpdf的pdftotext不能與編碼一起工作
import subprocess
pdf = r"path\to\file.pdf"
txt = r"path\to\out.txt"
pdftotext = r"path\to\pdftotext.exe"
cmd = [pdftotext, pdf, txt, '-enc UTF-8']
response = subprocess.check_output(cmd,
shell=True,
stderr=subprocess.STDOUT)
TB
CalledProcessError: Command '['path\\to\\pdftotext.exe',
'path\\to\\file.pdf', 'path\\to\\out.txt', '-enc UTF-8']'
returned non-zero exit status 99
當我刪除最後一個參數 '-enc UTF-8' 從CMD,它在Python的工作原理確定。
當我運行pdftotext pdf txt -enc UTF-8
在cmd
,它工作正常。
我缺少什麼?
謝謝。
我相信你需要'[pdftotext,PDF,TXT ,'-enc','UTF-8']' –
我試過了,但它工作但編碼不起作用。它給ANSI編碼的文件。 – Rahul
我看到了....將命令作爲字符串傳遞? –