1
我使用svm light文件作爲稀疏矩陣的存儲。爲什麼來自xgboost的dmatrix加載svm輕型文本文件如此之快
的測試表明,對於31700108x54070矩陣570601944個條目
import xgboost as xgb
dtrain = xgb.DMatrix(train_file)
使用21秒,方式快於
from sklearn.datasets import load_svmlight_file
x_train, y_train = load_svmlight_file(train_file)
使用7分鐘。
在攻擊代碼之前,有人可以幫我回答這個問題嗎?
你有什麼建議來提升load_svmlight_file函數嗎?
非常感謝!