2014-03-25 57 views
2

我想使用pdfminer來提取文本信息。我已經下載了pdfminer-20131113。我已經在C:\python34中安裝了python。 現在使用cmd,我將路徑設置爲pdfminer的setup.py文件。 並運行以下命令。使用python安裝pdfminer時出現語法錯誤

python setup.py install 

但我得到了下面的錯誤。

> D:\pdfminer-20101226>python setup.py install 
Traceback (most recent call last): 
    File "setup.py", line 3, in <module> 
    from pdfminer import __version__ 
    File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4 
    if __name__ == '__main__': print __version__ 
              ^
SyntaxError: invalid syntax 

這似乎是在pdfminer,我不知道如何解決setup.py文件中的一些錯誤。

另外,我在pdfminer的build文件夾中看到一個pdf2txt.py文件。我試圖使用這也作爲pdf2txt.py -o output.html pdffilename.pdf(完整路徑)。但不是轉換它。它打開pdf2txt.py文件。

+0

您忘記發佈錯誤訊息。很可能,代碼不是Python 3兼容的,需要Python 2才能運行。 –

+0

無關:不要使用'python setup.py install'。它不允許徹底卸載。改爲使用'pip install ..'。 python 3.4 – jfs

+0

中包含'pip',它試圖將它移植到Python 3:['pdfminer3k'](https://pypi.python.org/pypi/pdfminer3k) – jfs

回答

4

PDFMiner project homepage狀態:

完全寫在Python。 (對於2.4或更新的版本)

和進一步向下:

安裝Python 2.4或更高版本。 (Python 3不支持

所以你必須安裝Python 2來運行這個項目。

或者,您可以嘗試Python 3 port, pdfminer3k;它在20個月內沒有任何更新,而PDFMiner確實有更新的版本,所以你的里程可能會有所不同。

+0

好的。我會嘗試2.7版本。 – Maverick

+0

謝謝。有效。 – Maverick

+0

@Martijin,你能幫我pdf2txt.py 我想運行pdf2txt.py pdffile.pdf 但它打開pdf2txt.py – Maverick