我已標記的一個簡單的句子,這是我的代碼:編輯配置文件
package tagger;
import edu.stanford.nlp.tagger.maxent.MaxentTagger;
public class myTag {
public static void main(String[] args) {
MaxentTagger tagger = new MaxentTagger("D:/tagger/english-bidirectional-distsim.tagger");
String sample = "i go to school by bus";
String tagged = tagger.tagString(sample);
System.out.println(tagged);
}
}
這是輸出:
Reading POS tagger model from D:/tagger/english-bidirectional-distsim.tagger ... done [3.0 sec].
i_LS go_VB to_TO school_NN by_IN bus_NN
編輯屬性文件後它不完全有效果。 例如我已經將標記分隔符更改爲(*),但在輸出中它仍然打印(_)。
如何在eclipse中使用模型配置文件?在直接props
對象
Properties props = new Properties();
props.load(new FileReader("path/to/properties"));
MaxentTagger tagger = new MaxentTagger("D:/tagger/english-bidirectional-distsim.tagger", props);
您還可以設置屬性:
props.setProperty("tagSeparator", "*");
NB:
請注意,雙向模型[通常不是在實際應用中使用的最佳模型](http://nlp.stanford.edu/software/pos-tagger-faq.shtml#h)。還有其他一些模型爲了大幅提高速度而犧牲了少量精度。 – 2015-04-03 12:46:17