1
我有一個數組,其中第一列是類(以整數形式),其餘列是功能。如何創建scikit學習數據集?
SG這樣
1,0,34,23,2
0,0,21,11,0
3,11,2,11,1
我怎樣才能把它變成一個scikit兼容的數據集,所以我可以調用SG像 mydataset = datasets.load_mydataset()?
我有一個數組,其中第一列是類(以整數形式),其餘列是功能。如何創建scikit學習數據集?
SG這樣
1,0,34,23,2
0,0,21,11,0
3,11,2,11,1
我怎樣才能把它變成一個scikit兼容的數據集,所以我可以調用SG像 mydataset = datasets.load_mydataset()?
您可以簡單地使用熊貓。例如如果您已將數據集複製到dataset.csv文件。只需在csv文件中適當標註列即可。
In [1]: import pandas as pd
In [2]: df = pd.read_csv('temp.csv')
In [3]: df
Out[3]:
Label f1 f2 f3 f4
0 1 0 34 23 2
1 0 0 21 11 0
2 3 11 2 11 1
In [4]: y_train= df['Label']
In [5]: x_train = df.drop('Label', axis=1)
In [6]: x_train
Out[6]:
f1 f2 f3 f4
0 0 34 23 2
1 0 21 11 0
2 11 2 11 1
In [7]: y_train
Out[7]:
0 1
1 0
2 3
非常感謝 – giorgio79
永遠歡迎:) –