我有一個1.2crore行的大型數據集,這需要大約30分鐘在排序使用通常的SAS處理分類。 sas中有沒有更快的算法/選項? Kuber在sas中更快的排序選項?
0
A
回答
3
沒有你如何使用排序後的數據集和哪些領域和長度更多細節讓你的數據集這裏的幾件事情,你可以嘗試:
- 使用在PROC排序
tagsort
選項。當數據集很寬時,這很有用。 - 創建排序的指標來代替。如果你只是想通過小組處理來做一些事情,那麼這將會更快,並且也會工作得很好。
- 如果你是爲了做一個排序合併考慮使用SQL連接(這可能並不需要儘可能多的數據排序)或哈希表(可用於合併和不需要排序的數據)。
- 壓縮輸出數據集(如果你沒有的話)和/或輸入數據集。這將減少IO。
但回答你的問題,沒有更快的排序程序在sas然後proc sort
。根據下面PDF:的SAS®排序例程是順序O(NlogN),這是因爲快速 作爲比較排序可以是。
如果你有Syncsort的行貨那麼這可以加速它的網站正在努力,但是這通常是默認啓用。
0
如果需要排序的數據集的原因是爲了與其他數據集進行合併,你可能看使用HASH對象做您的合併/查找。那麼你可能不需要對它進行排序。
相關問題
- 1. 在SAS中自動排序
- 2. 爲什麼我的選擇排序比插入排序更快?
- 3. :SAS中的in =選項
- 4. 插入排序反向數組選擇排序更快嗎?
- 5. SAS選項metaserver
- 6. 重新排序列在SAS
- 7. sas按照編號排序和篩選
- 8. 如何排序比快速排序更快的整數數組?
- 9. python中更快的相似性排序
- 10. 在一個更大的項目中的選擇排序實現
- 11. 排序第二次更快
- 12. 如何更快排序ListView?
- 13. 在sas中的proc排名
- 14. SAS中的GPLOT中的顏色選項
- 15. 快速排序中位數選擇
- 16. 在GENMOD中SAS segfault with plot =選項
- 17. 算法 - 雙端選擇排序真的比單端排序更快嗎?
- 18. 快速排序在排序列表上花費更長時間
- 19. 排序選項的故障
- 20. 選擇快速排序的關鍵點
- 21. LISP中的快速排序
- 22. DrScheme中的快速排序
- 23. python中的快速排序
- 24. ML中的快速排序
- 25. PHP更快的關聯數組排序
- 26. 哪個選擇SQL查詢會更快:排序還是未排序?
- 27. jQuery中的可排序選項卡Sortable
- 28. 快速排序不排序
- 29. 在選擇排序,插入排序,合併排序和快速排序中計數比較?
- 30. 在JS選擇列表中按字母順序排序選項
羅布您好,PROC SQL確實排序內部,做一個內時除外加入和2個表中的一個被連接到小到足以裝配到memroy - 在這種情況下,它使用哈希聯接(因此不排序正在做)或者在使用索引連接時。將「_METHOD」添加爲PROC SQL選項,並查看它是否在後臺排序數據。 http://www2.sas.com/proceedings/forum2008/097-2008.pdf – 2012-09-04 14:52:25
好點。我猜你可以避免使用'from'表進行排序,只有被加入的表需要進行排序。所以這可能取決於情況?無論哪種方式,我已經更新了我的答案以反映您的評論。 –