我想獲得一些社區對良好設計的一致意見,以便能夠存儲和查詢單詞頻率計數。我正在構建一個應用程序,在該應用程序中,我必須解析文本輸入並存儲單詞出現的次數(隨着時間的推移)。因此,考慮以下輸入: 「殺死一隻小八哥」 「懲戒鋼琴玩家」 將存儲以下值: Word Count
-------------
To 1
Kill 1
A 2
Mocking 2
Bird 1
Piano 1
Pl
我想要計算字符串中的單詞(不包括某些關鍵字)的頻率並對它們進行排序DESC。那麼,我該怎麼做呢? 在下面的字符串... This is stackoverflow. I repeat stackoverflow.
凡不包括關鍵字 ExKeywords() ={"i","is"}
輸出應該像 stackoverflow
repeat
this
附:沒有!我不重新設計谷歌! :
關於如何計算C#中的單詞頻率,有一些很好的例子,但沒有一個是全面的,我真的需要一個在VB.NET中。 我目前的做法是每個頻率計數限制爲一個字。什麼是最好的方式來改變這一點,以便我可以得到一個完全準確的詞頻列表? wordFreq = New Hashtable()
Dim words As String() = Regex.Split(inputText, "(\W)")
For i