2017-09-22 66 views
0

我撿的Python ....嘗試使用重採樣並獲得以下錯誤 指https://elitedatascience.com/imbalanced-classes重採樣()在python錯誤

from sklearn.utils import resample 

df_majority = df[df.balance==0] 
df_minority = df[df.balance==1] 
#Upsample minority class 
df_minority_upsampled = resample(df_minority, 
           replace=True,  # sample with replacement 
           n_samples=576, # to match majority class 
           random_state=123) # reproducible results 
================= 
Error: 
Traceback (most recent call last): 
    File "<stdin>", line 5, in <module> 
    File "C:\Anaconda3\lib\site-packages\sklearn\utils\__init__.py", line 253, in resample 
    max_n_samples, n_samples)) 
ValueError: Cannot sample 576 out of arrays with dim 49 

感謝所有幫助... ..指針 謝謝

PS:我正在使用Zeppelin筆記本來嘗試這些。

回答

1

我很確定它與你的sklearn版本有關。 assert sklearn.__version__ >= 0.18 可能會導致異常現在的樣子。 :)

+0

scikit-learn版本是0.17.1。 – Binu

+0

所以更新它,你的問題就解決了。 :)他們只允許自0.18以來的升頻。 2016年4月2日更新 – Uvar

+0

好吧..將嘗試升級....檢查下采樣在0.17 ..它工作正常.. :-) ..謝謝。 – Binu