我試圖診斷ibv_reg_mr()在我使用的軟件中拋出的內存分配錯誤,我懷疑它與某些Mellanox Infiniband卡的已知問題有關,默認的最大內存可以註冊大約2GB(參見FAQ#18這裏http://www.open-mpi.org/faq/?category=openfabrics)。查找允許的最大值ibv_reg_mr
我希望能夠明確地確認是否屬實,以便我可以快速與系統管理員協商解決方案。不熟悉RDMA和Infiniband,有人可能會建議(a)一個簡單的程序,可以註冊任意數量的內存,以便我可以在最大允許值下觸發錯誤,或者(b)建議一種方式,讓我可能會決定Infiniband目前配置的方式,因爲我沒有root權限?
謝謝大家!
傑森
Hristo,很好的答案。謝謝! –
只需快速跟進一下:如果log_num_mtt設置爲0(對我而言),這是否表明設置爲_actually_零?這是否意味着它是默認設置? OFED 1.5.3的手冊說默認這個值是20。 –
這意味着只有一個MTT(1的log2是0)。你檢查了兩個模塊的設置嗎?模塊參數也可以在/etc/modprobe.d/中配置。 –