運行Python解釋並鍵入命令:
import nltk
>>> nltk.download()
>>> 一個新的窗口應打開,示出了NLTK下載程序。點擊文件菜單並選擇更改下載目錄。對於中央安裝,請將此設置爲C:\nltk_data (Windows)
,/usr/local/share/nltk_data
(Mac)或/usr/share/nltk_data (Unix)
。接下來,選擇要下載的軟件包或集合。
如果您未將數據安裝到上述其中一箇中心位置,則需要設置NLTK_DATA環境變量以指定數據的位置。 (在Windows機器上,右鍵單擊「我的電腦」,然後選擇屬性>高級>環境變量>用戶變量>新建...)
測試數據是否已安裝如下。 (這是假設你下載的布朗語料庫):
from nltk.corpus import brown
>>> brown.words()
>>> ['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
通過代理網絡服務器安裝
如果您的網絡連接使用代理服務器,你應該指定代理地址如下。在身份驗證代理的情況下,指定用戶名和密碼。如果代理設置爲無,則此功能將嘗試檢測系統代理。
nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))
>>> >>> nltk.download()
命令行安裝
下載程序將搜索安裝NLTK數據的現有nltk_data目錄。如果其中一個不存在,它將嘗試在中央位置(使用管理員帳戶時)或其他用戶的文件空間中創建一個。如有必要,請從管理員帳戶或使用sudo運行下載命令。推薦的系統位置是C:\nltk_data (Windows); /usr/local/share/nltk_data (Mac); and
/usr/share/nltk_data`(Unix)。你可以使用-d標誌來指定一個不同的位置(但是如果你這樣做,一定要相應地設置NLTK_DATA環境變量)。
運行命令python -m nltk.downloader all。要確保集中安裝,請運行命令sudo python -m nltk.downloader -d /usr/local/share/nltk_data all.
Windows:使用「開始」菜單上的「運行...」選項。 Windows Vista用戶需要首先打開該選項,使用開始 - >屬性 - >自定義來選中該框以激活「運行...」選項。
cf https://github.com/nltk/nltk/issues/1079 – alvas
http://stackoverflow.com/questions/34612023/install-nltk-in-python-2-7-for-64- bit-machine – alvas
見https://gist.github.com/alvations/0ed8641d7d2e1941b9f9 – alvas