我正在尋找一個信譽良好的Java,開源(最好)庫/包,它將文本作爲輸入並識別並標記其中的詞性。 組件,如: Verbs + Tense + Passive/Active {Simple Present, Past Progressive, Past Passive, Present Perfect ... }
Prepositions of movement {from, to...}
Pre
短版: 如果我有一朵朵字: Say 'comput' for 'computing', or 'sugari' for 'sugary' 有沒有一種方法來構建它最接近的名詞形式? That is 'computer', or 'sugar' respectively 加長版: 我使用Python和NLTK,共發現上一堆話執行一些語義相似的任務。 我注意到大多數sem-sim分數只適用於名詞,而形容
我對nlp相當陌生,我試圖弄清pos標籤。 我目前正試圖走出斯坦福NLP POS惡搞,網址:http://nlp.stanford.edu/software/tagger.shtml 從上面的鏈接,有這樣一句話: 打標籤可以在任何語言來重新培訓,給POS標註 培訓該語言的文本。 但是,我無法讓它工作。我現在所能做的就是給它一個文本文件來標記。例如, String test = "this is a
Penn Treebank tagset對於單詞「to」具有單獨的標記TO,而不管它是否用於介詞意義(如I went to school)或不定式意義(如I want to eat)。從NLP的整體角度來看,這有什麼用途?只是將無限期標記爲'分開'具有直觀意義,但我沒有看到將不定式和介詞組合在單個標籤中的邏輯。 謝謝,並道歉,如果這不符合堆棧溢出指導方針。