我使用Stanford POS tagger與GATE Twitter model和標記器需要大約3秒來初始化,這是正常還是我正確加載它?Stanford POS tagger與GATE twitter模型很慢
小樣本代碼:
package tweet.nlp.test;
import edu.stanford.nlp.tagger.maxent.MaxentTagger;
public class TweetNLPTest {
public static void main(String[] args) {
String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not ";
MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model");
String taggedText = tagger.tagString(text);
}
}
輸出:
從模型讀取POS惡搞模型/門EN-twitter.model ... 警告:沒有語言集,沒有指定開放類標籤,也沒有指定封閉類標籤;假設所有標籤都是開放類標籤 完成[3.1秒]。
My_PRP $ sister_NN won't_MD tell_VB me_PRP where_WRB she_PRP hid_VBD my_PRP $ food._NN She's_VBZ fueling_VBG my_PRP $ anorexia._NN #bestsisteraward_HT #not_HT _HT BUILD SUCCESSFUL (總時間:3秒)
看起來正常的我。 – Yasen 2014-11-02 07:51:14
@Yasen我想也許我沒有這樣做,因爲GATE模型擴展名爲'.model',而其他模型擴展名爲'.tagger'。這不需要做任何事情嗎? – 2014-11-02 12:36:46