2012-07-05 23 views
0

我有一個新問題。我有一個包含各種文本的列的數據庫,有沒有什麼方法可以讓SQL告訴我哪些是這些字段中使用的最常用的10個單詞?舉個例子:在sql中找到最常用的單詞

1我今天晚點回家。
2火車晚點。
3今天的火車時刻表是什麼?
4雪現在真的很糟糕。

和輸出優化將是:

是:3 晚:2 列車:2 今天:2

如果它是不可能與SQL做到這一點,否則你會建議我調查以獲取這些信息?

+0

您正在使用哪種服務器端語言 – 2012-07-05 12:24:59

+0

@ShehzadBilal OP正在尋找SQL解決方案。 – 2012-07-05 12:25:37

+0

閱讀最後一行 – 2012-07-05 12:26:16

回答

3

這在技術上可能在SQL中是可行的,但是當數據庫中有更多的行時,它會很痛苦而且很慢。

你所描述的問題是一個索引引擎的完美用例,例如Lucene(我用這個作爲一個例子,因爲你的問題在編輯之前首先包含標籤'java')。

+0

它應該重新標記。 – 2012-07-05 12:27:57

+0

@Ravinder:完成 – 2012-07-05 12:29:34

+0

我想要它..就像twitter ...趨勢,如果你曾經看到過......最....最討論的是字第一...所以最好的解決方案是什麼? – 2012-07-05 12:40:46

0

一種選擇是使用表值分割函數將每個單詞作爲一行返回;數它們;按數量降序排序

+0

我想要它..就像微博......趨勢,如果你曾經看到..它....最談論的字來第一...所以最好的解決方案是什麼? – 2012-07-05 12:39:38

相關問題