我想測試系統選項bufno
和bufsize
是否可以提高數據集的有效性。如何測試SAS DATA步驟中的IO吞吐量?
下面是測試代碼:
options bufno=1 bufsize=16k;
%atstart;
data target.dds_dep_pagesize16k;
set tune.dds_dep_pagesize16k(obs=2000000);
run;
%atend;
options bufno=100 bufsize=32k;
%atstart;
data target.dds_dep_pagesize16k;
set tune.dds_dep_pagesize16k(obs=2000000);
run;
%atend;
...
...
%atstart
和%atend
用於計算它們之間的程序的運行時間。
如果數據集的大小約爲800 Mb,那麼bufno
和bufsize
的更改對運行時間幾乎沒有影響。
不過很多論文都說bufno
和bufsize
可以優化程序。也許是因爲我正在運行同一SAS會話中的所有代碼,所以我沒有準確測量。我的問題是:我應該在單獨的會話中測試每個代碼運行時間,並且是否需要選擇更大的數據集?
需要使用更大的數據集,完全取決於數據集的大小,你會在生產環境中進行處理。 – JustinJDavies