dictvectorizer

    1熱度

    1回答

    我有一個324行和35列的數據集。我把它分成訓練和測試數據: X_train, X_test, y_train, y_test = train_test_split(tempCSV[feaure_names[0:34]], tempCSV[feaure_names[34]], test_size=0.2, random_state=32) 這似乎很好地工作,我的X_train和X_test都

    2熱度

    4回答

    我有一個包含41個特徵[0到40列]的數據集,其中7個是分類的。 字符串類型的一個子集(列特徵1,2,3) 整型的一個子集,以二進制形式0或1(列 - :該分類組是在兩個子集劃分功能6,11,20,21) 此外,(字符串類型)的列特徵1,2和3分別具有基數3,66和11。 在這種情況下,我必須對它們進行編碼以使用支持向量機算法。 這是我的代碼: import numpy as np import