主題表有30M行。我正在執行查詢以查找重複的hash
。 hash
被定義爲在30M記錄表中查找重複的列
`hash` varchar(50) NOT NULL;
查詢是
SELECT Count(*)
FROM (SELECT Count(id) `num`,
`signature`
FROM `images`
WHERE `hash` IS NOT NULL
GROUP BY `hash`
HAVING `num` > 1) AS `count_table`
它需要前約5-7分鐘我按下Ctrl+C
中止查詢。我再次運行它,仍然無法等待那麼久。
我怎樣才能更快得到這個結果?
我知道這樣做會稍微慢一點,但是我認爲8分鐘太多了。
你對'hash'或...呃..'signature'的指數? –
請發佈您的餐桌結構 –