stop-words

    2熱度

    2回答

    for x,y in words: for z in x: if z in stopwords: del x[x.index(z)] 這是我的代碼。在字的數據是元組的列表,其中一個元組看起來是這樣的: (list of words, metadata) 我的代碼的目的是從單詞的列表中刪除所有的禁用詞。 唯一的問題是,停用詞不會被刪除後... 我究竟做錯了

    0熱度

    3回答

    我嘗試使用tidyverse(http://tidyverse.org/)分析德語句子列表。我堅持這個指南(http://tidytextmining.com/)。 當我嘗試使用德語停用詞表時,它不起作用。 library(tidyverse) library(readxl) # read excel library(tibble) # tobble dataframe library(dp

    2熱度

    1回答

    我遇到的問題是,在我的代碼中,我無法獲取單個詞/標記以匹配停用詞從原始文本中刪除。相反,我得到了一整句話,因此無法將它與停用詞相匹配。請告訴我一種方法,我可以獲取個人令牌,然後用停用詞匹配並刪除它們。請幫幫我。 from nltk.corpus import stopwords import string, os def remove_stopwords(ifile): proces

    0熱度

    1回答

    由於某種原因,我收到錯誤NameError: name 'stopwords' is not defined,即使我已經安裝了該軟件包。我試圖對一些反饋評論進行自然語言處理。 dataset對象是具有兩列的表格,Reviews (a sentence of feedback)和目標變量Liked (1 or 0)。謝謝,謝謝! 塊1 import re import nltk nltk.dow

    0熱度

    2回答

    儘管已經有關於向RTextTools提供停用詞的自定義列表的解答,但我想了解有關訪問現有/默認停用詞列表的任何命令。

    0熱度

    1回答

    我使用以下代碼從輸入文本中刪除停用詞。當tokenStream.incrementToken()運行時,我得到異常。 java.lang.IllegalStateException: TokenStream contract violation: reset()/close() call missing, reset() called multiple times, or subclass doe

    -1熱度

    1回答

    我正在讀取文件中的停止詞,我將它保存在HashSet中。我比較說HashSet與String檢查停用詞。 如果我在String-變量中放置了一個單詞,例如「the」,那麼我的輸出是「Yes」。但是,如果我將「Apple is it」或「它是一個蘋果」這樣的東西輸出爲「No」,儘管String -variables包含停用詞。 這裏的整個程序,包含兩種方法,一種用於讀取文件和一個用於去除停止詞: p

    2熱度

    2回答

    我在Python中使用stop_words包。目錄路徑usr/local/lib/python2.7/dist-packages/stop_words/stop-words中的english.txt文件中的停用詞的原始數目爲174,並且我添加了幾個,列表變爲218。 我用下面的命令來獲得停止詞 from stop_words import get_stop_words en_stop = ge

    1熱度

    1回答

    我有一個包含2柱csv文件「投訴詳細」和「DispositionCode'.I要的complaintDetails分爲8不同類別dispostionCode的如‘門反鎖’ ,'供應商錯誤','缺少密鑰或鎖'... 數據集顯示在圖像中。 enter image description here 什麼是很好的方法來分類和找到準確性。 起初我試圖從ComplaintDetails去除停用詞然後用naiv

    0熱度

    1回答

    我試圖從我從Twitter導入的推文中刪除停用詞。刪除停用詞後,字符串列表將被放置在同一行的新列中。我可以一次輕鬆地完成這一行,但試圖在整個數據框上循環方法似乎並不成功。 我該怎麼做? 摘錄我的數據: tweets['text'][0:5] Out[21]: 0 Why #litecoin will go over 50 USD soon ? So ma... 1 get 20 free #