我有一個數千行的MySQL數據庫表。該表是設置像這樣:如何在我的MySQL varchar列中創建最常見子字符串的有序列表?
id | text
的id
列是一個自動遞增的整數,並且text
列是200個字符的VARCHAR。
說我有以下行:
3 | I think I'll have duck tonight
4 | Maybe the chicken will be alright
5 | I have a pet duck now, awesome!
6 | I love duck
然後我想生成列表可能是這樣的:
'鴨' 的 'I'- 3次出現 '具有' '雞'
- .etc .etc
另外,我可能想要維護一個從列表中忽略的子字符串列表,比如'I','will'和'have。重要的是要注意,我不知道人們會發布什麼。
我沒有我想監視的單詞列表,我只想找到最常見的子字符串。然後,我將通過編輯查詢來手動過濾掉列表中不感興趣的任何錯誤的子字符串。
任何人都可以建議最好的方法來做到這一點?感謝大家!