dictvectorizer

1熱度

1回答

我有一個324行和35列的數據集。我把它分成訓練和測試數據： X_train, X_test, y_train, y_test = train_test_split(tempCSV[feaure_names[0:34]], tempCSV[feaure_names[34]], test_size=0.2, random_state=32) 這似乎很好地工作，我的X_train和X_test都

2熱度

4回答

如何在sklearn中編碼分類特徵？

我有一個包含41個特徵[0到40列]的數據集，其中7個是分類的。字符串類型的一個子集（列特徵1，2，3）整型的一個子集，以二進制形式0或1（列 - ：該分類組是在兩個子集劃分功能6，11，20，21）此外，（字符串類型）的列特徵1,2和3分別具有基數3,66和11。在這種情況下，我必須對它們進行編碼以使用支持向量機算法。這是我的代碼： import numpy as np import