0
我需要使用斯坦福POS標記器標記Tweets中的文字。斯坦福POS標記器的POS直方圖
如這裏1解釋的,我使用的類MaxentTagger,然後方法:maxtagger.tagString("This is a sample text");
這產生輸出:
This_DT is_VBZ a_DT sample_NN text_NN
現在,我必須爲每條推文創建每個標籤發生的直方圖推文。我在JavaDoc中搜索過,但沒有發現任何用處。
如果我必須自己創建直方圖,如何以其他方式讀取輸出而不是字符串(例如,標記列表)?
似乎很好,但我怎麼能得到一個對象: java.util.List <?從字符串文本擴展HasWord> ? – Francesco