我正在使用NLTK從列表元素中刪除停用詞。 這裏是我的代碼片段在python中使用NLTK刪除停用詞
dict1 = {}
for ctr,row in enumerate(cur.fetchall()):
list1 = [row[0],row[1],row[2],row[3],row[4]]
dict1[row[0]] = list1
print ctr+1,"\n",dict1[row[0]][2]
list2 = [w for w in dict1[row[0]][3] if not w in stopwords.words('english')]
print list2
的問題,這不僅消除了禁用詞,但是從例如換言之也被刪除人物從'方向'這個詞'我'和更多的停用詞將被刪除,並進一步它是存儲字符,而不是單詞列表2中。 ie ['O','r','e','n','n','','f','','3','','r','e','r ','e','','p','n','\ n','\ n','\ n','O','r','e','n','n ','','f','','n','','r','e','r','e','','r','p','l'。 ...................... 雖然我想將它作爲['Orientation','.............. ......
嘗試先標記您的單詞 – galaxyan
代碼中的內容是什麼?你能發佈更多的上下文代碼嗎? –