2014-01-15 60 views
0

我想配置jython與nltk一起使用。爲了讓jython知道nltk,我在我的機器("C:\Python27\Lib\site-packages")中安裝了python模塊的site_packages的路徑添加到我正在實現的jython項目的外部庫中,該路徑添加到項目屬性下的構建路徑項目。 當我輸入nltk.bookfrom nltk.book import *),我收到以下錯誤:jython無法找到nltk_data

LookupError: 
********************************************************************** 
    Resource 'corpora/gutenberg' not found. Please use the NLTK 
    Downloader to obtain the resource: >>> nltk.download() 
    Searched in: 
    - 'C:\\Users\\sodara/nltk_data' 
    - '/usr/share/nltk_data' 
    - '/usr/local/share/nltk_data' 
    - '/usr/lib/nltk_data' 
    - '/usr/local/lib/nltk_data' 

我試圖從下載的Jython內NLTK但沒有成功。

代碼的相同部分在python中完美運行,沒有任何錯誤。

我使用python 2.7和jython 2.5.3。

我發現像錯誤說,你需要下載使用nltk.download()

添加數據(語料庫和東西)是NLTK的Python實例地處\應用程序數據\漫遊\的NLTK數據nltk_data

回答

0

這樣的事情在你的代碼:

if not os.path.isdir(os.path.expanduser('~/nltk_data')): 
    nltk.download(download_dir=os.path.expanduser('~/nltk_data') 

您也可以只下載軟件包,您需要:

nltk.download(package_name, download_dir=os.path.expanduser('~/nltk_data') 
+0

我嘗試使用此路徑nltk.download。 (download_dir = os.path.expanduser( 'C:\\用戶\\ sodara/nltk_data')。下面的錯誤。 SyntaxError:不匹配的輸入'\ n'期待RPAREN。以爲這是轉義字符問題試過\\ nltk還是有同樣的問題。 +你能知道爲什麼nltk可以在python中訪問數據,但不能在jython中訪問數據? – unlockme

1

檢查您的NLTK下載器默認下載目錄:

import nltk 
nltk.download() 

這是最有可能的C:\Users\<username>\AppData\Roaming\nltk_data - 我把它拷貝到Jython是看在目錄