15
我需要建立文本分類,現在我使用TfidfVectorizer和SelectKBest來選擇功能,如下:顯示功能名稱
vectorizer = TfidfVectorizer(sublinear_tf = True, max_df = 0.5, stop_words = 'english',charset_error='strict')
X_train_features = vectorizer.fit_transform(data_train.data)
y_train_labels = data_train.target;
ch2 = SelectKBest(chi2, k = 1000)
X_train_features = ch2.fit_transform(X_train_features, y_train_labels)
我想打印出選定的功能名稱(文本)選擇k最佳功能後,有沒有辦法做到這一點?我只需要打印出選定的功能名稱,也許我應該使用CountVectorizer呢?