假設一張5000萬個姓氏的表格(例如),如何有效地識別前10000個?如何有效識別大表中最流行的字符串?
難道還有比這更有效的查詢?
SELECT count(last_name) as cnt, last_name
FROM last_name_table
GROUP BY last_name
ORDER BY cnt DESC
LIMIT 10000;
假設:
CREATE TABLE last_name_table (
`last_name` VARCHAR(255),
KEY `last_name` (`last_name`)
);
我可以在20分鐘內獲得最高1000。但是,排名前10000的人正在整天(字面上)。有什麼建議麼?
我目前停留在「複製到tmp目錄的磁盤表」。 – Ryan