有關矩陣乘法的文獻中有各種算法可以擴展到MPI範例。例如:
> 1Dsystolic [1]
> 2D-systolic, Cannon’s algorithm [2];
> Fox’s algorithm [3];
> Berntsen’s algorithm [4];
> DNS algorithm [5].
如果忽略該矩陣禮(稀疏ECT),它基本上恢復關於如何其分佈的處理中的同步和負載不平衡(工作的每個過程之間分配量最小化的數據)。
在這recent work你可以看到兩種不同的數據分佈方法和他們之間的比較。
論文:
[1] Golub G.H and Van C.H L., 「Matrix Computations.」,Johns Hopkins University Press, 1989.
[2] Whaley R. C., Petitet A., Dongarra J. J., 「Automated empirical optimizations of software and the ATLAS project」 Parallel Computing 27, 1.2 (2001), 3.35.
[3] Fox G. C., Otto S. W., and Hey A. J. G., 「Matrix algorithms on a hypercube I:
Matrix multiplication」,Parallel Computing, vol. 4, pp. 17-31. 1987.
[4] Berntsen J.,「Communication efficient matrix multiplication on hypercubes, Parallel Computing」, vol. 12, pp. 335-342, 1989.
[5] Ranka S. and Sahni S., 「Hypercube Algorithms for Image Processing and Pattern Recognition」, Springer- Verlag, New York, NY, 1990.