如何提高COUNT（DISTINCT field1）... GROUP BY field2的性能？

我有以下查詢如何提高COUNT（DISTINCT field1）... GROUP BY field2的性能？

EXPLAIN SELECT COUNT(DISTINCT ip_address) as ip_address, exec_date 
    FROM requests 
    GROUP BY exec_date; 

id select_type table  type  possible_keys key   key_len ref  rows Extra 
1 SIMPLE  requests range  NULL   daily_ips 263  NULL 488213 Using index for group-by (scanning)

隨着覆蓋索引daily_ips

Table  Non_unique Key_name Seq_in_index Column_name Collation Cardinality Sub_part Packed Null Index_type Comment Index_comment 
requests 1   daily_ips 1    exec_date A   16   NULL  NULL YES BTREE  
requests 1   daily_ips 2    ip_address A   483492  NULL  NULL YES BTREE

有沒有什麼辦法可以進一步優化此查詢？

Using index for group-by (scanning)是什麼意思？這是否意味着整個GROUP BY子句完全是從索引完成的，而COUNT(DISTINCT ip_address)部分則不是？

來源

2012-11-27 user784637

根據您提供的數據，我看不到任何方式可以進一步優化查詢。

至於你的後續問題，MySQL的描述解釋輸出Using index for group-by手冊頁說：

類似於使用索引表訪問方法，使用指數組的指示是，MySQL發現了一個索引可用於檢索GROUP BY或DISTINCT查詢的所有列，而無需對實際表進行任何額外的磁盤訪問。此外，索引以最有效的方式使用，因此對於每個組，只有少數索引條目被讀取。有關詳情，請參閱Section 8.13.10, 「GROUP BY Optimization」。

您的索引特別適合加快查詢速度。由於只有索引字段被選中（查詢中的每一列也出現在索引中），因此所有相關數據都出現在索引中，MySQL甚至可能根本不需要打表。

如果執行查詢就像在google上執行搜索，想象不必點擊任何鏈接的網站，因爲您直接在搜索結果中找到了您要查找的信息 - 這有點像什麼需要掃描表格數據就好。這裏有一些關於how MySQL uses indexes的更多信息：

在某些情況下，可以優化查詢來檢索值而不用諮詢數據行。（爲查詢提供所有必要結果的索引稱爲covering index。）如果查詢僅使用表中的數字爲列的某些鍵的最左前綴的列，則可以從索引樹中檢索所選值更大的速度：

SELECTkey_part3FROMtbl_nameWHEREkey_part1 = 1

來源

2012-11-27 18:29:55

感謝Danny，出於好奇，有沒有什麼辦法可以判斷'使用索引for group-by（掃描）'是指應用於GROUP BY或DISTINCT子句的索引？ – user784637

由於'DISTINCT'只是[GROUP BY'的特例（http://dev.mysql.com/doc/refman/5.0/en/distinct-optimization.html），並且由於兩列來自同樣的表格，相同的索引，我真的不確定。 –

您你能對象化：

Objectify ofy = ObjectifyService.begin（）; 查詢查詢= ofy.query（這裏是類名稱.class）.filter（「表中的列名」，要查詢的值）.list（）;

在此之前，您可能需要爲Objectify添加jar。

來源

2012-11-28 03:06:49 Swaprks

如何提高COUNT（DISTINCT field1）... GROUP BY field2的性能？

回答

相關問題