我想獲得一些社區對良好設計的一致意見,以便能夠存儲和查詢單詞頻率計數。我正在構建一個應用程序,在該應用程序中,我必須解析文本輸入並存儲單詞出現的次數(隨着時間的推移)。因此,考慮以下輸入:跟蹤/計數字頻率
- 「殺死一隻小八哥」
- 「懲戒鋼琴玩家」
將存儲以下值:
Word Count
-------------
To 1
Kill 1
A 2
Mocking 2
Bird 1
Piano 1
Player 1
和更高版本能夠快速查詢給定任意單詞的計數值。
我目前的計劃是簡單地將單詞和計數存儲在數據庫中,並依靠緩存單詞計數值......但是我懷疑我沒有獲得足夠的緩存命中時間以使其成爲長期可行的解決方案。
任何人都可以提出算法,或數據結構,或任何其他想法,可能會使這一表現良好的解決方案?