蟒蛇ntlk donwload給解析器eror

我試圖運行下面的命令蟒蛇ntlk donwload給解析器eror

import nltk 
nltk.download('all')

但我收到此錯誤

Traceback (most recent call last): 
    File "./update.py", line 3, in <module> 
    nltk.download('all') 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 664, in download 
    for msg in self.incr_download(info_or_id, download_dir, force): 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 534, in incr_download 
    try: info = self._info_or_id(info_or_id) 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 508, in _info_or_id 
    return self.info(info_or_id) 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 875, in info 
    self._update_index() 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 825, in _update_index 
    ElementTree.parse(compat.urlopen(self._url)).getroot()) 
    File "/usr/lib/python3.6/xml/etree/ElementTree.py", line 1196, in parse 
    tree.parse(source, parser) 
    File "/usr/lib/python3.6/xml/etree/ElementTree.py", line 597, in parse 
    self._root = parser._parse_whole(source) 
xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 23, column 143

我是新來的蟒蛇，所以我真的不知道是什麼我應該怎麼做。我查看了上面報告的源模塊，並注意到它正在嘗試下載xml文件。所以我跑了下面的命令，並沒有給我任何錯誤。

compat.urlopen('https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml')

所以我認爲沒有問題的下載，但在解析器。有人可以建議我怎麼從這裏開始？

來源

2017-04-14 user3602300

我也得到了同樣的問題在這裏 – Bart

這個問題 –

開始發生幾個小時前我 – silentser

問題在於NLTK返回的XML。

xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 23, column 143

在23：143，我們看到了問題，缺少「=」：

... unzip="1" unzipped_size"1917" url="https...

NTLK一定會很快解決這個問題，直到那時我不知道最好的迴應是什麼。

來源

2017-04-14 15:09:19 dbug12

index.xml有一個錯字。它已經被修補。剛剛檢查和nltk.download('all')工作正常！

見：nltk/nltk_data#70

來源

2017-04-14 15:21:33

是啊，現在工作得很好..謝謝 – user3602300

蟒蛇ntlk donwload給解析器eror

回答

相關問題