2012-07-19 61 views
7

我想在無法連接到互聯網的SUSE Linux機器上運行nltk。如何在脫機Linux機器上安裝nltk的english.pickle

我已成功安裝NLTK,它運行,但是當我提交

>>> tagged = nltk.pos_tag(tokens) 

我得到這個錯誤:

LookupError:
**********************************************************************
Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource:

我不能使用下載,因爲我不能盒連接到互聯網。

有沒有人如何安裝必要的軟件包?

回答

2

下載程序將文件存儲在特定文件夾中。我想可以在在線機器上下載並將文件複製到離線機器上的同等位置。在我的機器上,它下載到/usr/local/lib/nltk_data

+0

感謝您的建議 - 如果我要在Windows計算機上執行此操作,下載的文件將在Linux機器上運行嗎? – 2012-07-19 11:01:02

+0

對不起,我剛剛看到你的評論。我不知道,但我想數據應該是跨平臺的(除了可能的行結束)。 – darkphoenix 2012-07-23 09:34:51

3

將數據下載到nltk_data目錄。這裏說的從一個系統到另一個不同,但你可以通過執行以下操作找出:

import nltk 
print nltk.data.find('.') 

english.pickle應在<nltk_data>/taggers/的子文件夾。最簡單的方法是在可以訪問互聯網的機器上使用下載器,然後將其複製並放入同一個子文件夾中。 english.pickle只有一個版本,您可以在Windows上下載它,沒問題。

相關問題