2016-11-16 17 views
0

我正在使用jupyter筆記本在kaggle https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-1-for-beginners-bag-of-words上練習此問題。內核在使用nltk.download時變得很忙

當我使用下面的代碼

進口NLTK
nltk.download()#下載文本數據集,包括停止詞

內核雲在忙碌狀態,然後我無法執行任何細胞進一步。

+0

你的系統上是否安裝了python-tkinter? 'nltk.download()'打開一個tkinter窗口,您可以在其中選擇需要下載的軟件包。一旦他們被下載,關閉窗口,jupyter會帶你到下一個單元格。嘗試在交互式shell中運行相同的東西,而不是jupyter。 –

回答

1

當您運行nltk.download()時,它會啓動一個交互式GUI窗口,您可以使用它來下載資源。但很多時候,這個窗口隱藏在屏幕上的其他窗口後面。找到它,下載你需要的任何東西,然後關閉下載器窗口,以便腳本將控制權返回給筆記本內核。

爲了避免代碼獲取到下載命令時掛起,可以使用非交互式下載命令。例如,布朗語料庫的nltk.download("brown")nltk.download("book"),以通過閱讀nltk書籍獲得所需的所有資源。這些將執行下載(即使您已經擁有所請求的資源)而無需打開GUI窗口。爲此,您需要知道或猜測您想要的資源的內部名稱。

相關問題