stop-words

2熱度

2回答

for x,y in words: for z in x: if z in stopwords: del x[x.index(z)] 這是我的代碼。在字的數據是元組的列表，其中一個元組看起來是這樣的： (list of words, metadata) 我的代碼的目的是從單詞的列表中刪除所有的禁用詞。唯一的問題是，停用詞不會被刪除後... 我究竟做錯了

0熱度

3回答

R：在逆向中使用德語停用詞，但防加入不起作用

我嘗試使用tidyverse（http://tidyverse.org/）分析德語句子列表。我堅持這個指南（http://tidytextmining.com/）。當我嘗試使用德語停用詞表時，它不起作用。 library(tidyverse) library(readxl) # read excel library(tibble) # tobble dataframe library(dp

2熱度

1回答

如何在Python中逐個讀取文件中的令牌？

我遇到的問題是，在我的代碼中，我無法獲取單個詞/標記以匹配停用詞從原始文本中刪除。相反，我得到了一整句話，因此無法將它與停用詞相匹配。請告訴我一種方法，我可以獲取個人令牌，然後用停用詞匹配並刪除它們。請幫幫我。 from nltk.corpus import stopwords import string, os def remove_stopwords(ifile): proces

0熱度

1回答

NameError：name'stopwords'is not defined

由於某種原因，我收到錯誤NameError: name 'stopwords' is not defined，即使我已經安裝了該軟件包。我試圖對一些反饋評論進行自然語言處理。 dataset對象是具有兩列的表格，Reviews (a sentence of feedback)和目標變量Liked (1 or 0)。謝謝，謝謝！塊1 import re import nltk nltk.dow

0熱度

2回答

如何訪問RTextTools中的停用詞表？

儘管已經有關於向RTextTools提供停用詞的自定義列表的解答，但我想了解有關訪問現有/默認停用詞列表的任何命令。

0熱度

1回答

使用apache lucene取消停用詞時的異常

我使用以下代碼從輸入文本中刪除停用詞。當tokenStream.incrementToken()運行時，我得到異常。 java.lang.IllegalStateException: TokenStream contract violation: reset()/close() call missing, reset() called multiple times, or subclass doe

-1熱度

1回答

字符串沒有正確檢查停止詞

我正在讀取文件中的停止詞，我將它保存在HashSet中。我比較說HashSet與String檢查停用詞。如果我在String-變量中放置了一個單詞，例如「the」，那麼我的輸出是「Yes」。但是，如果我將「Apple is it」或「它是一個蘋果」這樣的東西輸出爲「No」，儘管String -variables包含停用詞。這裏的整個程序，包含兩種方法，一種用於讀取文件和一個用於去除停止詞： p

2熱度

2回答

即使在將停用詞添加到english.txt文件後，爲什麼停用詞不會更新？

我在Python中使用stop_words包。目錄路徑usr/local/lib/python2.7/dist-packages/stop_words/stop-words中的english.txt文件中的停用詞的原始數目爲174，並且我添加了幾個，列表變爲218。我用下面的命令來獲得停止詞 from stop_words import get_stop_words en_stop = ge

1熱度

1回答

無法移除停止詞; NLP

我有一個包含2柱csv文件「投訴詳細」和「DispositionCode'.I要的complaintDetails分爲8不同類別dispostionCode的如‘門反鎖’ ，'供應商錯誤'，'缺少密鑰或鎖'... 數據集顯示在圖像中。 enter image description here 什麼是很好的方法來分類和找到準確性。起初我試圖從ComplaintDetails去除停用詞然後用naiv

0熱度

1回答

從推文中刪除停用詞Python

我試圖從我從Twitter導入的推文中刪除停用詞。刪除停用詞後，字符串列表將被放置在同一行的新列中。我可以一次輕鬆地完成這一行，但試圖在整個數據框上循環方法似乎並不成功。我該怎麼做？摘錄我的數據： tweets['text'][0:5] Out[21]: 0 Why #litecoin will go over 50 USD soon ? So ma... 1 get 20 free #