pos-tagger

    4熱度

    1回答

    我正在使用斯坦福標記確定詞類。但是,我想從文本中獲得更多信息。是否有可能獲得進一步的信息,如句子的時態或主動/被動? 到目前爲止,我使用的是非常基本的POS-標記方法: List<List<TaggedWord>> taggedUnits = new ArrayList<List<TaggedWord>>(); String input = "This sentence is going to

    3熱度

    1回答

    我想要使用斯坦福POS-tagger,我想問一下是否可以解析(實際上只有pos標籤就足夠了)英文文本以conll格式輸出結果。有這樣的選擇嗎? 我使用的是完整版本3.2.0斯坦福POS惡搞的 非常感謝

    0熱度

    1回答

    我想用斯坦福tagger代替複數,以單數(例如從女孩到女孩)。 private static final String vbnTag = "VBN"; private static final String vbdTag = "VBD"; private static final String jjTag = "JJ"; private static final String edSuff

    2熱度

    1回答

    我需要編寫一段代碼,對產品進行幾行評論作爲輸入,並根據描述評論中產品的形容詞對產品進行評分。我剛剛使用POS tagger來標記每條評論的詞性。現在,我必須選出描述名詞的形容詞,如果名詞似乎與產品有關,我需要考慮相應的形容詞。這是我用於POS標記的代碼。它只是正常工作。 import java.io.*; import edu.stanford.nlp.tagger.maxent.MaxentT

    0熱度

    2回答

    我試過在nltk中創建詞性(或POS)標記器,但是我無法在一次使用退避的情況下使它工作於多個ngram標記器。我讀到,你使用更多的標籤獲得更高的分數,但它不適合我。我希望它首先使用更多的單詞,然後使用更少的單詞。我試了一下這個樣子, import nltk from nltk.corpus import brown #sentence = brown.sents(categories = "

    0熱度

    2回答

    我試圖使用Hunpos tagger用於NLTK的POS標記而不是傳統的pos_tag(),但我在加載二進制文件english.model或en_wsj.model時遇到了一些問題。 事實上,我在Linux Mint的,我把它們放在/usr/local/bin,在HUNPOS環境變量設置爲這條道路,甚至試圖以這個路徑傳遞到__init__nltk/tag/hunpos.py的文件中使用的參數pat

    1熱度

    2回答

    我努力訓練這將根據我的具體vocabulary.for例如,在一個句子標記的話opennlp POS惡搞: 正常詞性標註後: 一句話:節點管理器/ NNP未能/ VBD到/啓動/ VB中/ DT服務器/ NN 使用我的詞性標註的模型後: 一句:節點管理器/代理未能/其他與/其他啓動/其他/ OTHER服務器/ OBJECT 其中AGENT,OTHER,OBJECT是我定義的標籤。 所以基本上我正在

    6熱度

    1回答

    我正在使用Stanford POS Tagger執行POS標籤。標記器僅爲輸入句子返回一個可能的標記。例如,當提供輸入句子「The clown weeps。」時,POS標記器產生(錯誤的)「The_DT clown_NN weeps_NNS ._」。 但是,我的應用程序將嘗試解析結果,並可能會拒絕POS標記,因爲沒有辦法解析它。因此,在這個例子中,它會拒絕「The_DT clown_NN weep

    4熱度

    1回答

    我想通過批處理文件爲不同的文件運行一個標記器。這是我的代碼: String runap1="cd spt1"+"\n"+"java -Xss8192K -Xms128m -Xmx640m -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/bidirectional-

    1熱度

    1回答

    我對nlp相當陌生,我試圖弄清pos標籤。 我目前正試圖走出斯坦福NLP POS惡搞,網址:http://nlp.stanford.edu/software/tagger.shtml 從上面的鏈接,有這樣一句話: 打標籤可以在任何語言來重新培訓,給POS標註 培訓該語言的文本。 但是,我無法讓它工作。我現在所能做的就是給它一個文本文件來標記。例如, String test = "this is a