有誰知道從文本體中只提取名詞的最簡單方法嗎?從文本中提取名詞(Java)
我聽說過TreeTagger tool,我試着給它一個鏡頭,但由於某種原因無法工作。
有什麼建議嗎?
感謝菲爾
編輯:
import org.annolab.tt4j.*; TreeTaggerWrapper tt = new TreeTaggerWrapper(); try { tt.setModel("/Nouns/english.par"); tt.setHandler(new TokenHandler() { void token(String token, String pos, String lemma) { System.out.println(token+"\t"+pos+"\t"+lemma); } }); tt.process(words); // words = list of words } finally { tt.destroy(); }
這是我的代碼,英語是語言。我得到錯誤:類型new TokenHandler(){}必須實現繼承的抽象方法TokenHandler.token。難道我做錯了什麼?
思維來解釋究竟是什麼沒有用TreeTagger工作? – 2009-12-11 17:46:06
你能指定你的問題嗎?特別是語言會很好理解......德語例如具有所有名詞都具有大寫首字母的好處。 – Chris 2009-12-11 18:00:25
我並不熟悉TreeTagger API,但是我會從setHandler()外面實例化TokenHandler開始 - 這可能會給出更清晰的消息。我的猜測是,TokenHandler是抽象的,但... – 2009-12-11 18:27:29