什麼樣的優化會提高我的表現？

我寫了一個基於排序算法（合併排序，選擇排序）的小型java程序，並顯示了排序人員對象（名稱，升序）所需的時間。什麼樣的優化會提高我的表現？

該程序的C++版本比java版本慢至少4倍。有幾個開發人員說，他們通過優化代碼來排序Java。釋放模式，/ O2，64位，...。我已經做了這些調整。

我的排序算法（特別是合併排序）有沒有效率低下？

//create a subvector 
template <typename T> std::vector<T> splitVec(std::vector<T> main, size_t from, size_t to) { 

std::vector<T>::const_iterator first = main.begin() + from; 
std::vector<T>::const_iterator last = main.begin() + to; 
std::vector<T> erg(first, last); 

return erg; 
} 

//merge sort - sorting process 
template <typename T> std::vector<T> merge(std::vector<T> m1, std::vector<T> m2) { 

unsigned int posA = 0, posB = 0; 

std::vector<T> erg; 

while (posA < m1.size() && posB < m2.size()) { 
    if (m1.at(posA).compareTo(m2.at(posB)) <= 0) { 
     erg.push_back(m1.at(posA)); 
     posA++; 
    } 
    else { 
     erg.push_back(m2.at(posB)); 
     posB++; 
    } 
} 

while (posA < m1.size()) { 
    erg.push_back(m1.at(posA)); 
    posA++; 
} 

while (posB < m2.size()) { 
    erg.push_back(m2.at(posB)); 
    posB++; 
} 

return erg; 
} 

//merge sort-split up vectors 
template <typename T> std::vector<T> mergeSort(std::vector<T> pers) { 

if (pers.size() > 1) { 

    //Split pers into two equally sized vectors 
    std::vector<T> p1(splitVec(pers, 0, pers.size()/2)); 
    std::vector<T> p2(splitVec(pers, (pers.size()/2), pers.size())); 

    return merge(mergeSort(p1), mergeSort(p2)); 
} 
else 
    return pers; 
}

由於事先

來源

2016-03-14 TalipVural

傳遞參數（const-）引用而不是值來避免額外的副本。 – Jarod42

你傳遞和返回值的向量。在C++中，這會複製向量的所有元素。 – Rotem

代碼結構中的優化通常優於編譯器優化設置。通過引用而不是按值傳遞向量將是一個好的第一步。 [預留（）']（http://en.cppreference.com/w/cpp/container/vector/reserve）預先容納的空間需要容易的一秒。至少這兩人應該把你和Java放在同一個地方。公平起見，至少你沒有「新」每一個對象，所以有希望。 ;-) – DevSolar

通過引用傳遞載體中。這應該會顯着提高性能。

在按值傳遞載體複製每次（在每個步驟添加了O（n）的複雜性）

來源

2016-03-14 13:02:07

感謝您的快速回復:) – TalipVural

那麼你缺少一個非常大的優化它。您將按值傳遞所有矢量，而不是通過引用。這意味着每個函數調用都是複製非常低效的向量。

因爲java中的所有東西都是一個指針，所以你的java代碼不會使所有這些副本成爲C++代碼減速的主要部分。

來源

2016-03-14 13:02:41 NathanOliver

通過引用傳遞源數據而不是複製源數據將是一個巨大的改進。

另外，您應該在erg的reserve空間中，否則在添加更多內容時，您會反覆重新分配和複製所有元素。

來源

2016-03-14 13:06:57

它是否真的導致複製所有元素？ – user463035818

@ tobi303如果新元素不適合當前分配的空間，則將所有元素重新分配到內存中的新位置。 – Rotem

@ tobi303：是的，它的確如此。 –

不要傳遞向量。不按價值，而不是參考。通過迭代器：

template <class Iter> 
void sort(Iter first, Iter last) { 
    ... 
} 

sort(my_vector.begin(), my_vector.end();

要分割的範圍，只是計算的中間值：

template <class Iter> 
Iter mid(Iter first, Iter last) { 
    return first + (last - first)/2; 
}

這假設代碼仍然排序在某種容器中存放的值（原代碼， std::vector），所以迭代器是隨機訪問迭代器。

來源

2016-03-14 14:10:05

我會嘗試，但我從來沒有聽說過迭代器。 – TalipVural

@TalipVural - 迭代器是STL三部曲的一部分：迭代器，算法，容器。它們是C++標準庫大部分功能的基礎。挖掘這個主題將是非常值得的。 [這是一個鏈接]（https://cal-linux.com/tutorials/STL.html）到我剛剛查找的教程。不知道這是否有益，但快速瀏覽顯示它有一定的承諾。 –

使用push_back代替索引很慢。對工作數組或向量進行一次性分配，並對該數組進行索引可以避免執行所有這些遞歸分配。使用一對相互遞歸的函數消除了在合併後不得不復制數據。

自底向上合併排序會稍微快一點，而自底向上合併排序通常是大多數庫使用的（如std :: stable_sort），自上而下的合併排序似乎是在教室中教導的內容。

適用於數組或向量的向上合併排序的示例模板（將向量作爲指向第一個元素的指針傳遞）。

template <typename T> 
void TopDownSplitMergeAtoA(T a[], T b[], size_t ll, size_t ee); 
template <typename T> 
void TopDownSplitMergeAtoB(T a[], T b[], size_t ll, size_t ee); 
template <typename T> 
void TopDownMerge(T a[], T b[], size_t ll, size_t rr, size_t ee); 

template <typename T> 
void MergeSort(T a[], size_t n)    // entry function 
{ 
    if(n < 2)        // if size < 2 return 
     return; 
    T *b = new T[n]; 
    TopDownSplitMergeAtoA(a, b, 0, n); 
    delete[] b; 
} 

template <typename T> 
void TopDownSplitMergeAtoA(T a[], T b[], size_t ll, size_t ee) 
{ 
    if((ee - ll) == 1)     // if size == 1 return 
     return; 
    size_t rr = (ll + ee)>>1;   // midpoint, start of right half 
    TopDownSplitMergeAtoB(a, b, ll, rr); 
    TopDownSplitMergeAtoB(a, b, rr, ee); 
    TopDownMerge(b, a, ll, rr, ee);  // merge b to a 
} 

template <typename T> 
void TopDownSplitMergeAtoB(T a[], T b[], size_t ll, size_t ee) 
{ 
    if((ee - ll) == 1){     // if size == 1 copy a to b 
     b[ll] = a[ll]; 
     return; 
    } 
    size_t rr = (ll + ee)>>1;   // midpoint, start of right half 
    TopDownSplitMergeAtoA(a, b, ll, rr); 
    TopDownSplitMergeAtoA(a, b, rr, ee); 
    TopDownMerge(a, b, ll, rr, ee);  // merge a to b 
} 

template <typename T> 
void TopDownMerge(T a[], T b[], size_t ll, size_t rr, size_t ee) 
{ 
    size_t o = ll;       // b[]  index 
    size_t l = ll;       // a[] left index 
    size_t r = rr;       // a[] right index 
    while(1){        // merge data 
     if(a[l] <= a[r]){     // if a[l] <= a[r] 
      b[o++] = a[l++];    // copy a[l] 
      if(l < rr)      // if not end of left run 
       continue;     //  continue (back to while) 
      while(r < ee)     // else copy rest of right run 
       b[o++] = a[r++]; 
      break;       //  and return 
     } else {       // else a[l] > a[r] 
      b[o++] = a[r++];    // copy a[r] 
      if(r < ee)      // if not end of right run 
       continue;     //  continue (back to while) 
      while(l < rr)     // else copy rest of left run 
       b[o++] = a[l++]; 
      break;       //  and return 
     } 
    } 
}

來源

2016-03-15 15:44:53 rcgldr

謝謝。我會和老師討論你的版本。你爲什麼通過數組大小？難道你不能用array.size（）獲取它嗎？ – TalipVural

在C/C++中，數組沒有大小。一個向量有一個大小，但是這個模板是爲數組設計的，所以對於一個向量來說，指向第一個元素的指針和向量的大小（元素數量）作爲參數傳遞給MergeSort（）.. – rcgldr

什麼樣的優化會提高我的表現？

回答

相關問題