2017-08-06 69 views
2

我想使用RandomOverSampler函數從imbalanced-learn模塊對超過兩個類的數據執行過採樣。下面是我的代碼有3類:使用imblearn對多類數據進行過採樣

import numpy as np 
from imblearn.over_sampling import RandomOverSampler 

data = np.random.randn(30,5) 
label = np.random.randint(3, size=30) 

ros = RandomOverSampler(random_state=3) 
data_res, label_res = ada.fit_sample(data, label) 

運行後,它會返回這樣的警告:

UserWarning:目標類型應該是二進制文件。 warnings.warn( '的 目標類型應該是二進制的。')

documentation說:

支持輯陣級重採樣。

我是否錯過了將它用於多類案例?如果這僅適用於二進制類,是否還有其他支持多類過採樣的庫或模塊?

回答

2


我昨天遇到同樣的情況,
我用暢達安裝庫,
我找到的文件 - > base.py
它有什麼用GitHub上的最新版本不同。

所以我的Git通過github上
https://github.com/scikit-learn-contrib/imbalanced-learn
克隆的最新版本
然後,
萬物就行了!
你可以使用多級井