我有一個新問題。我有一個包含各種文本的列的數據庫,有沒有什麼方法可以讓SQL告訴我哪些是這些字段中使用的最常用的10個單詞?舉個例子:在sql中找到最常用的單詞
1我今天晚點回家。
2火車晚點。
3今天的火車時刻表是什麼?
4雪現在真的很糟糕。
和輸出優化將是:
是:3 晚:2 列車:2 今天:2
如果它是不可能與SQL做到這一點,否則你會建議我調查以獲取這些信息?
我有一個新問題。我有一個包含各種文本的列的數據庫,有沒有什麼方法可以讓SQL告訴我哪些是這些字段中使用的最常用的10個單詞?舉個例子:在sql中找到最常用的單詞
1我今天晚點回家。
2火車晚點。
3今天的火車時刻表是什麼?
4雪現在真的很糟糕。
和輸出優化將是:
是:3 晚:2 列車:2 今天:2
如果它是不可能與SQL做到這一點,否則你會建議我調查以獲取這些信息?
這在技術上可能在SQL中是可行的,但是當數據庫中有更多的行時,它會很痛苦而且很慢。
你所描述的問題是一個索引引擎的完美用例,例如Lucene(我用這個作爲一個例子,因爲你的問題在編輯之前首先包含標籤'java')。
它應該重新標記。 – 2012-07-05 12:27:57
@Ravinder:完成 – 2012-07-05 12:29:34
我想要它..就像twitter ...趨勢,如果你曾經看到過......最....最討論的是字第一...所以最好的解決方案是什麼? – 2012-07-05 12:40:46
一種選擇是使用表值分割函數將每個單詞作爲一行返回;數它們;按數量降序排序
我想要它..就像微博......趨勢,如果你曾經看到..它....最談論的字來第一...所以最好的解決方案是什麼? – 2012-07-05 12:39:38
您正在使用哪種服務器端語言 – 2012-07-05 12:24:59
@ShehzadBilal OP正在尋找SQL解決方案。 – 2012-07-05 12:25:37
閱讀最後一行 – 2012-07-05 12:26:16