pos-tagging

    1熱度

    1回答

    我正在嘗試創建一個新的列,該列中的數據框中有clean_word列的pos標籤。如下圖所示,該列有單個單詞。所以不需要標記等等。 下面是我的代碼。 import nltk datahitword['pos_tag'] = nltk.pos_tag(datahitword['clean_word']) datahitword.head() 即使在將列轉換爲列表和系列以將其隔離並添加到數據框

    0熱度

    2回答

    我想使用文本文件作爲輸入來評估NLTK中的不同POS標記。 例如,我將採用Unigram標記器。我發現如何使用棕色語料庫評估Unigram標籤。 from nltk.corpus import brown import nltk brown_tagged_sents = brown.tagged_sents(categories='news') brown_sents = brown.se

    0熱度

    2回答

    我正在尋找一種方法來爲我在R中的列表中的單個詞/標記創建POS標記。我知道,如果我爲單個標記執行此操作,準確性會降低而不是句子,但我擁有的數據是來自維基百科的「刪除編輯」,人們大多刪除單個不連接的單詞而不是整個句子。我幾次看到這個問題的Python,但我還沒有找到它在R的解決方案。 我的數據看起來somehwat這樣 Tokens <- list(c("1976","green","Normand

    1熱度

    2回答

    我使用nltk .tokenize(),.pos_tag()和wordnet .synsets()獲得以下輸出。輸出是用於文件和共發現自己的部分詞性標註每個令牌可能匹配的列表的列表(在這裏,我們有4個令牌,因此,比賽的4名名單): [[Synset('document.n.01'), Synset('document.n.02'), Synset('document.n

    0熱度

    1回答

    我是一名Python新手,想在從本地計算機導入csv文件後進行POS標記。我從網上查找了一些資源,發現下面的代碼有效。 text = 'Senator Elizabeth Warren from Massachusetts announced her support of Social Security in Washington, D.C. on Tuesday. Warren joined

    0熱度

    1回答

    我使用textacy的pos_regex_matches方法來查找句子中的某些文本塊。 例如,假設我有文本:Huey, Dewey, and Louie are triplet cartoon characters.,我想檢測Huey, Dewey, and Louie是枚舉。 要做到這一點,我用下面的代碼(在testacy 0.3.4,可用的版本在寫作的時間):它打印 import textac

    1熱度

    1回答

    nltk tagged_sents與tagged_words有什麼區別? 他們似乎都是元組列表(單詞,標籤)。如果你做的類型(),它們都是 nltk.collections.LazySubsequence

    0熱度

    1回答

    我想爲每行中的每個單詞做標記(每行包含幾個句子)。 我有這樣的代碼: import nltk import pos_tag import nltk.tokenize import word_tokenize f = open('C:\Users\test_data.txt') data = f.readlines() #Parse the text file for NER with

    0熱度

    2回答

    如何返回true如果輸入中的第一個單詞是動詞,我需要我的函數返回true。 我試過這個,但它不起作用(即使它是一個動詞也沒有返回任何東西),有人可以告訴我一個我做錯了什麼的例子。還有一個正確的做法是,謝謝你! def All(): what_person_said = input() what_person_said_wt = nltk.word_tokenize(what_p

    1熱度

    1回答

    每個記錄詞性標註我有這樣 Task Response 1 NA 2 NA 3 EFFICACY 4 I was sent to external vendor for solution (PDA parts), but at PDA parts they identified within few minites that new battery would not solve the