我有以下基準,它遍歷數組, 設置下一個條目加上前一個條目。如果 的數字大於某個上限,我將條目 設置爲零,然後繼續。然後在最後我總結數組中的條目 。如何提高PolyML中的數組基準性能?
問題:如何改進PolyML的基準測試結果?
的時間如下Ubuntu上的x86-64:
polyml (using CFLAGS=O3) =
1250034994
real 0m54.207s
user 0m52.604s
sys 0m0.792s
g++ (O3) =
1250034994
real 0m4.628s
user 0m4.578s
sys 0m0.028s
我能得到mlton幾乎一樣快的C代碼(5.2s), 運行,但我在PolyML特別感興趣,因爲 它使用最新版本的gcc在Windows 7中無縫地構建。 (對於MSYS/MSYS2和MinGW gcc編譯器看到http://lists.inf.ed.ac.uk/pipermail/polyml/2015-August/001593.html爲polyML 構建說明在Windows 7)
在Windows 7上我有問題,構建最新版本 mlton與海灣合作委員會的最新版本(類似問題在 https://github.com/MLton/mlton/issues/61#issuecomment-50982499 )
的SML的代碼是:
val size:int = 50000;
val loops:int = 30000;
val cap:int = 50000;
val data:int array = Array.array(size,0);
fun loop() =
let
fun loopI i =
if i = size then
let val _ =() in
Array.update(data,0,Array.sub(data,size-1));
()
end
else
let val previous = Array.sub(data,i-1)
val use = if previous > cap then 0 else previous in
Array.update(data,i,use+1);
loopI (i+1)
end
in loopI 1 end
fun benchmarkRun() =
let
fun bench i =
if i = loops then()
else let val _ =() in
loop();
bench (i+1)
end
in bench 1 end
fun sum (i,value) =
if i = size then value
else sum(i+1,value+Array.sub(data,i))
fun main() = let val _ =() in
benchmarkRun();
print (Int.toString (sum (0,0)));
print "\n"
end
(*val _ = main()*)
和C++代碼是:
#include <iostream>
#include <vector>
using namespace std;
int size = 50000;
int loops = 30000;
int cap = 50000;
vector<int> data(size);
void loop(){
int previous, use;
for(int i=1; i<size; i++){
previous = data[i-1];
if(previous > cap){
use = 0;
}else{
use = previous;
}
data[i] = use + 1;
}
data[0] = data[size-1];
}
void benchmarkRun(){
for(int i=1; i<loops; i++){
loop();
}
}
int sum(){
int res = 0;
for(int i=0; i<size; i++){
res += data[i];
}
return res;
}
int main(){
benchmarkRun();
cout<<sum()<<endl;
}
謝謝。根據你的建議,我在源代碼中找到了一個'unsafeSub'和'unsafeUpdate',它們在使用時縮短了大約20s的polyml時間。 – artella