part-of-speech

-1熱度

1回答

要創建一個自然語言計算器，我嘗試了nltk中的TrigramTagger。我想在給定句子中標記乘法和2個數字。例如：「什麼是5和7的乘積」，這裏的'product'是'binary.multiply'，'5'是'num-1'，'7'是'num-2'。一旦我可以標記這3個，我可以很容易地計算出答案。但是，正如你在下面的輸出中可以看到的，我無法訓練關於這兩個數字的標記器。數字必須與訓練完全相同，否

0熱度

1回答

POLYGLOT >> ValueError：未找到包裹u'pos2.ms

我學會使用polyglot爲POS標籤提供印度尼西亞文本。 import polyglot from polyglot.text import Text, Word text=Text("Menurut dia, Syahganda, dikenal sebagai penggiat isu-isu pertanahan serta perburuhan.") print text.pos

1熱度

2回答

NLTK單詞詞性標註

有沒有一種方法可以使用NLTK獲得單字母字符串的一組可能的詞性，並考慮到不同詞可能具有同音異義詞？例如：報告 - > {名詞，動詞}，善良 - > {形容詞，名詞} 我一直沒能找到一個POS-標記者標記部分的語音單詞之外完整句子的背景。這似乎是NLTK的一個非常基本的要求，所以我很困惑爲什麼我很難找到它。

0熱度

1回答

如何實現C＃中的給定字符串數組的語音標記？

我需要一個簡單的英文POS標記程序，僅在c＃中實現。

0熱度

1回答

使用多個文本文件訓練Stanford POS tagger

我有一個大約20000個文本文件的語料庫，我想使用這些文本文件來訓練tagger，這更好，可以將這些文本文件分組到一個文本文件中（我不知道它是否會影響標記的準確性或不包括所有這些文本文件在道具文件中？

1熱度

1回答

Spacy NLP - 使用正則表達式分塊

Spacy包含noun_chunks功能來檢索一組名詞短語。功能english_noun_chunks（附後）使用word.pos == NOUN def english_noun_chunks(doc): labels = ['nsubj', 'dobj', 'nsubjpass', 'pcomp', 'pobj', 'attr', 'root'] np_d

1熱度

1回答

在句子中找到代詞和名詞之間的關係

我正在研究NLP項目，我需要通過示例說明以下功能。說有句話告訴山姆，他不得不離開亞瑟，因爲他生病了。在這份聲明中，第一he必須加以標記，以薩姆和第二he亞瑟。我使用Python工作。關於我可以用來獲得以下功能的任何建議？

0熱度

1回答

專有名詞檢測首字母縮寫詞縮略語

我正在爲斯特拉斯堡的CDS開發自然語言搜索引擎。（斯特拉斯堡的天文數據中心）我想知道斯坦福的詞性標註器是如何標註縮寫詞的，因爲縮寫詞有時被標記爲NNP，有時被標記爲NN。我無法準確找到程序是如何決定像「CDS」或「NASA」這樣的首字母縮略詞是NNP還是NN。如果有人能夠幫助我解決這個問題，我會非常高興。 :) 祝您有美好的一天。

2熱度

2回答

Python：將NLTK Stanford POS標籤映射到WordNet POS標籤

我正在閱讀一系列句子，並使用NLTK的斯坦福POS機標籤標記每個單詞。我得到像這樣的輸出： wordnet_sense = [] for o in output: a = st.tag(o) wordnet_sense.append(a) 輸出：[[(u'feel', u'VB'), (u'great', u'JJ')], [(u'good', u'JJ')]] 我想這

-1熱度

1回答

Python NLTK PoS標記不準確

我一直在努力改善NLTK上的POS標記幾天，但我無法弄清楚。目前，默認標記器確實不準確，並將大多數單詞標記爲「NN」。我如何改進標記器以使其更加準確？我已經看過培訓tagger，但我無法使它工作。有沒有人有一個簡單的方法呢？非常感謝。