我試圖使用Hunpos tagger用於NLTK的POS標記而不是傳統的pos_tag()
,但我在加載二進制文件english.model
或en_wsj.model
時遇到了一些問題。如何正確設置NLTK中的Hunpos tagger用於英文POS標記?
事實上,我在Linux Mint的,我把它們放在/usr/local/bin
,在HUNPOS
環境變量設置爲這條道路,甚至試圖以這個路徑傳遞到__init__
nltk/tag/hunpos.py
的文件中使用的參數path_to_bin
,但是當它識別該文件,它會拋出此錯誤:
>>> ht = HunposTagger('en_wsj.model','/usr/local/bin/en_wsj.model')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/local/lib/python2.7/dist-packages/nltk-2.0.4-py2.7.egg/nltk/tag/hunpos.py", line 89, in __init__
shell=False, stdin=PIPE, stdout=PIPE, stderr=PIPE)
File "/usr/lib/python2.7/subprocess.py", line 679, in __init__
errread, errwrite)
File "/usr/lib/python2.7/subprocess.py", line 1249, in _execute_child
raise child_exception
OSError: [Errno 8] Exec format error
有沒有人知道發生了什麼?
一般來說,我更喜歡預編譯的版本太多,但是當我3個月前試過要麼沒有工作或我需要在代碼中進行一些小變化,我不記得他們中的哪一個。這就是爲什麼我試圖編譯標籤。 – rafa