2014-04-05 45 views
0

仍然有這個問題!在MYSQL中調整術語頻率?

我在SQL有4個字段的表:FILEID,SENTENCEID,WORDID和WORD。

我在每個文件下面給出每個文件下的給定文件編號,每個文本下每一個句子下面都有一個唯一編號,我給每個單詞指定一個唯一編號,如圖所示。

我正在計算單詞在每個文檔中顯示的次數。我只知道如何計算一個術語在此表中總共顯示的次數。任何人都可以建議如何基於FILEID計算?非常感謝。 Below是我擁有的表格。

enter image description here

這是我當前的查詢:

SELECT WORD, COUNT(*) FROM (SELECT WORD FROM ASSIGNMENT2 GROUP BY FILEID); 
+0

這是很難沒有看到你的數據庫架構來回答。另外,「term」和「document」是什麼意思? – ATG

+0

這是多個文件的集合。圖片中的FILEID表示不同的文件。術語是指單詞。在一個句子中,每個單詞都有一個唯一的ID,從1,2,3,4 ... ...一旦句子結束,我將重新分配1,2,3 ......到一個新句子中的單詞。 –

+0

好的。那麼,我的理解是,我正確地找出了某個特定單詞出現在特定文件中的次數? – ATG

回答

1

我會說:

select FILEID, WORD, count(WORD) from ASSIGNMENT2 group by FILEID, WORD