2012-10-08 19 views
0

指定名詞的頻率在文本我有一個文件包含附有POS標記,如用java

Tom/NNP went/VBP to/IN the/DT stadium/NN ....etc 

我需要知道的所有名詞的頻率包含在此文件中的話。因此,輸出可能是

stadium  12 
football 20 
player  13 

其中,這些數字是這些名詞出現在文本中的數字時代。我怎麼能在java中做到這一點?

+1

通過編寫一個使用Map 的程序? – bmargulies

+0

首先閱讀[Java IO教程](http://docs.oracle.com/javase/tutorial/essential/io/charstreams.html),當有更具體的問題時再回來。 –

+0

所以你需要匹配所有具有'/ NN'後面的單詞並對它們進行計數? – Bergi

回答

1

有一個從字符串(名詞)到整數(計數)的地圖。遍歷文件中的每個單詞。檢查'/'後的單詞部分,如果它是一個名詞,如果它不在那裏,則將它放在地圖上,如果它不在那裏,則將其放在地圖上,或者將1加到現有值上。然後遍歷地圖,打印出鍵/值對。