在數據庫中排序數據的優缺點？

我們假設我有一個帶有VARCHAR類型的字段的表。我需要從該字段按字母順序獲取該表中的數據。在數據庫中排序數據的優缺點？

什麼是最佳方式（用於性能）：將order by field添加到SQL查詢中或對數據進行排序時，它已被提取？

我使用Java（與Hibernate），但我不能告訴任何關於數據庫引擎。它可以是任何流行的關係數據庫（如MySQL或MS Sql Server或Oracle或HSQL DB或任何其他）。

表中的記錄數量可能差別很大，但我們假設有5k條記錄。

UPD：第二級休眠緩存（例如EHCache）如何支持排序數據？

2010-05-17 Roman

如果此字段已編入索引，那麼平均數據庫在此任務中的效率將高於Java。還要注意，如果是純顯示，通常不會一次檢索所有這些行，而是檢索它的一個子集，以便可以通過分頁顯示它。您也可以在數據庫級別執行此操作。使用Java對數據進行排序需要將整個表格拖入Java內存中，但您不希望這樣做。

在Hibernate中，你可以使用Criteria#addOrder()結果排序並使用Criteria#setFirstResult()和Criteria#setMaxResults()分頁。例如。

List users = session.createCriteria(User.class) 
    .addOrder(Order.asc("username")) 
    .setFirstResult(0) // Index of first row to be retrieved. 
    .setMaxResults(10) // Amount of rows to be retrieved. 
    .list();

來源

2010-05-17 11:49:25 BalusC

感謝這一點。這不是索引不幸的，但我會記住進一步的情況。 – Roman 2010-05-17 11:52:43

即便如此，在一個體面的數據庫中這樣做比在Java中這樣做更有效率。這是事實。該數據庫專爲那些數據排列和分組目的而設計。受益其權力。 – BalusC 2010-05-17 12:04:12

對數據庫中的數據進行排序 - 這是其中的一部分。數據庫引擎可能比您更好地對這些數據進行排序。

來源

2010-05-17 11:48:48

我的解決方案是爲排序列創建索引，並使用order by clause寫入查詢。

來源

2010-05-17 11:49:36 Sujee

什麼是最好的方式（用於性能）：將字段添加到SQL查詢或排序數據時，它已被提取？

這是ORDER BY，不能排序。

這是一個折中的問題：客戶端的排序是分佈式的，這意味着對服務器的影響較小。但是，它可能需要更多的客戶端資源。

如果現場沒有被索引，返回排序的整體，記錄集中的服務器將需要做以下事情：

取整記錄
排序它
發送過來的網絡向客戶端

，而排序在客戶端僅需要指出1和3（它們是至少資源密集型）。

如果服務器需要同時爲數百個客戶端提供服務，並且客戶端需要整個記錄集，那麼很可能在客戶端進行排序會更有效率。

如果該字段已編入索引，則數據庫可以返回已從該索引中排序的數據。但是，這需要額外的表查找來獲取其他字段。另外，如果你不想整個記錄集，但只有一些頂部字段（如ORDER BY LIMIT或SELECT TOP … ORDER BY），整個recorset將不需要通過網絡獲取和傳輸。在這種情況下，數據庫方面的訂購可能會更有效率。

來源

2010-05-17 11:50:03 Quassnoi

謝謝，我的壞，會糾正。上次我差不多2年前做過了。 – Roman 2010-05-17 11:51:16

對於只有5千條記錄，它並沒有真正有什麼區別，但是我把它分類爲數據庫;即使這個領域沒有索引，但可能至少和之後一樣快。

來源

2010-05-17 11:50:17 Artefacto

臨排序在數據庫：

速度。如果按條件在訂單上有索引，則數據庫不應該根本排序，爲了獲得最佳性能，您可以使用聚簇索引。
易於使用。 SQL查詢中的order by比Java比較器更容易編寫和維護。

臨排序中的應用：

可定製性。也許你想按照更精細的標準進行排序，那麼Java中的自定義排序將更加靈活。
重複性。如果您爲不同的數據庫編碼，他們的Collating rules可能會有所不同。也許這是一個問題，你想要一個特定的選擇。在Java中，您可以編寫一個Custom Collator以確保所有數據庫的輸出都以相同的方式排序。

來源

2010-05-17 11:59:41 wallenborn