2011-07-14 21 views
4

我想解析進入我的系統的字符串,並在單獨的表中保留每個單詞的字數。問題是許多常見的詞,如'the','at'等將被包括在內,不應該是。我不想手工創建字典。任何人都知道我可以匹配的一個體面的字典,不包括?謝謝。試圖創建「趨勢詞/短語」引擎,但需要過濾掉常見詞

+0

這可能是一個良好的開端:http://en.wikipedia.org/wiki/Most_common_words_in_English – LainIwakura

回答