我想將一個sklearn預測添加到熊貓數據框中,以便我可以對預測進行全面評估。的初步認識的代碼如下:將scikit-klearn(sklearn)預測添加到熊貓數據框中
clf = linear_model.LinearRegression()
clf.fit(Xtrain,ytrain)
ypred = pd.DataFrame({'pred_lin_regr': pd.Series(clf.predict(Xtest))})
的dataframes看起來像這樣:
XTEST
axial_MET cos_theta_r1 deltaE_abs lep1_eta lep1_pT lep2_eta
8000 1.383026 0.332365 1.061852 0.184027 0.621598 -0.316297
8001 -1.054412 0.046317 1.461788 -1.141486 0.488133 1.011445
8002 0.259077 0.429920 0.769219 0.631206 0.353469 1.027781
8003 -0.096647 0.066200 0.411222 -0.867441 0.856115 -1.357888
8004 0.145412 0.371409 1.111035 1.374081 0.485231 0.900024
ytest
8000 1
8001 0
8002 0
8003 0
8004 0
ypred
pred_lin_regr
0 0.461636
1 0.314448
2 0.363751
3 0.291858
4 0.416056
串聯XTEST和ytest正常工作:
df_total = pd.concat([Xtest, ytest], axis=1)
但ypred事件信息丟失。
什麼是必須的python/pandas/numpy樣的方式來做到這一點?
我使用以下版本:
argparse==1.2.1
cycler==0.9.0
decorator==4.0.4
ipython==4.0.0
ipython-genutils==0.1.0
matplotlib==1.5.0
nose==1.3.7
numpy==1.10.1
pandas==0.17.0
path.py==8.1.2
pexpect==4.0.1
pickleshare==0.5
ptyprocess==0.5
py==1.4.30
pyparsing==2.0.5
pytest==2.8.2
python-dateutil==2.4.2
pytz==2015.7
scikit-learn==0.16.1
scipy==0.16.1
simplegeneric==0.8.1
six==1.10.0
sklearn==0.0
traitlets==4.0.0
wsgiref==0.1.2
我試過如下:
df_total["pred_lin_regr"] = clf.predict(Xtest)
似乎做的工作,但我想我不能確定的事件相匹配正確