創建未排序數組索引的最快方法

我正在處理一個存在未排序數組的問題。我需要處理這個數組以便生成一個索引數組，就好像它是按升序排序的。創建未排序數組索引的最快方法

實施例1：

讓我們說我有一個未排序的陣列[9,7，8,6，12]

而作爲一個輸出，我需要索引陣列[3，1,2，... 0，4]。

實施例2：

未排序數組：[10，9，11，8，12] 索引陣列應該是：[2，1，3,0，4]

截至目前，我這樣做就像老式的「泡沫排序」，我在比較每一種可能性。我想知道如何讓它變得更快。

來源

2015-06-07 dhruvvyas90

@HighPerformanceMark它可以去高達10^5，我不擔心，此刻額外的空間？我正在尋找方法來優化它以使其更快。 – dhruvvyas90

'[2，1，3，0，4]'看起來不正確，因爲它對應於[11,9,8,10,12]，這不是升序。 – dasblinkenlight

根據數組中的值對索引進行排序（它們從0開始到大小-1）。自下而上的合併排序比快速/堆排序快一些，因爲它通常比較少，移動次數也更少。比較涉及引用索引和數組值，而移動只涉及索引。 – rcgldr

如果您不擔心額外的空間，這樣做：

做對的數組按升序值（第一部件）(value, index)
排序對
收穫指數（第二從對

使用您的數據爲例的有序數組成員），你會得到這樣的：

[{9,0}, {7,1}, {8,2}, {6,3}, {12,4}] // Step 1 
[{6,3}, {7,1}, {8,2}, {9,0}, {12,4}] // Step 2 
[ 3,  1,  2,  0,  4 ] // Step 3

（評論）我需要的是一個未排序數組的索引，就好像它們按升序排序。

您也可以使用步驟3中的數組生成此輸出。使用你的第二個例子，你會得到這樣的：

[{10,0}, {9,1}, {11,2}, {8,3}, {12,4}] 
[ {8,3}, {9,1}, {10,0}, {11,2}, {12,4}] 
[ 3,  1,  0,  2,  4 ]

現在創建輸出數組，走索引的陣列（即[3,1,0,2,4]）和每個項目的指標設置成價值，即確定在結果的位置索引3將得到0，因爲3在索引0處，索引1將得到1，因爲1在1處，索引0將得到2，因爲0在2處，依此類推。

下面是另外的步驟的圖示：

int position[] = {3, 1, 0, 2, 4}; 
int res[5]; 
for (int i = 0 ; i != 5 ; i++) { 
    res[position[i]] = i; 
}

這將產生以下的數組：

[2, 1, 3, 0, 4]

來源

2015-06-07 11:53:08 dasblinkenlight

明白了。所以基本上我需要選擇一個優化的排序算法，以使其更快。（與O（n^2）的冒泡排序相比，可能是合併排序或快速排序。） – dhruvvyas90

我認爲這種方法並不總是給出準確的結果。以[{10,0}，{9,1}，{11,2}，{8,3}，{12,4}]爲例。通過這種方法，它的順序爲[3,1,0,2,4]，而實際順序爲：[2,1,3,0,4]。有什麼想法嗎？ – dhruvvyas90

@dastaan爲什麼正確的順序是[2,1,3,0,4]？這意味着[11，9，8，10，11]是正確的順序，但正確的順序是[8,9,10,11,11]。 – dasblinkenlight

「快速」意味着您需要一個複雜度爲O（log n）的插入（當然還有查找）的排序數據結構。所以二叉樹就可以做到。

來源

2015-06-07 11:52:18 DrKoch

您需要插入n個對象，因此這是O（n log n），並且二叉樹操作比O（n log n）排序（如合併排序）花費更多的時間。如果在C++中對索引進行排序，那麼通常使用合併排序的std :: stable_sort（）會比std :: sort（）快一些，這是一種前奏排序，如果嵌套變得太快深。 – rcgldr

創建索引作爲位置的數組，並將其初始化到現有的順序：idx = [0,1,2，...，n-1]。
然後，使用您喜歡的排序算法對索引數組進行排序，但是每次執行比較時，都會使用這些值作爲位置來引用原始數組，而不是直接比較它們。例如，要比較項目i和j，執行cmp（arr [idx [i]]，arr [idx [j]]）而不是cmp（idx [i]，idx [j]）。

來源

2015-06-07 11:54:06

python中的3條指令：arr = [9，7，8，6，12] idx = [i for range in（len（arr）） ] idx.sort（lambda i，j：cmp（arr [i]，arr [j]）） –

這個答案與「dasblinkenlight」的答案基本相同，只是更好，因爲它不需要所有冗餘他的答案的步驟，如分配額外的空間，複製值，並最終指出它們（當你可以使用參考位置與原始數組進行比較時，爲什麼要做這些事情？） –

你嘗試基數排序：

* Approach: 
* radix sort, like counting sort and bucket sort, is an integer based 
* algorithm (i.e. the values of the input array are assumed to be 
* integers). Hence radix sort is among the fastest sorting algorithms 
* around, in theory. The particular distinction for radix sort is that it 
* creates a bucket for each cipher (i.e. digit); as such, similar to 
* bucket sort, each bucket in radix sort must be a growable list that may 
* admit different keys. 

***************************************************************************/ 
import java.io.IOException; 


public class RadixSort { 

    public static void sort(int[] a) 
    { 
     int i, m = a[0], exp = 1, n = a.length; 
     int[] b = new int[10]; 
     for (i = 1; i < n; i++) 
      if (a[i] > m) 
       m = a[i]; 
     while (m/exp > 0) 
     { 
      int[] bucket = new int[10]; 

      for (i = 0; i < n; i++) 
       bucket[(a[i]/exp) % 10]++; 
      for (i = 1; i < 10; i++) 
       bucket[i] += bucket[i - 1]; 
      for (i = n - 1; i >= 0; i--) 
       b[--bucket[(a[i]/exp) % 10]] = a[i]; 
      for (i = 0; i < n; i++) 
       a[i] = b[i]; 
      exp *= 10;   
     } 
    } 

    public static void main(String[] args) throws IOException { 

     int[] aa={9,7,8,6,12}; 
     for (int i = 0; i < aa.length; i++) { 
      System.out.print(aa[i]+" "); 
     } 
     System.out.println(); 
     sort(aa); 
     for (int i = 0; i < aa.length; i++) { 
      System.out.print(aa[i]+" "); 
     } 
    } 


}

來源

2015-06-07 12:07:20

創建未排序數組索引的最快方法

回答

相關問題