1
我正在使用不同的機器學習算法實現不同的分類器。Scikit-learn的管道:錯誤與多標籤分類。通過稀疏矩陣
我整理的文本文件,並做如下:
classifier = Pipeline([
('vectorizer', CountVectorizer()),
('TFIDF', TfidfTransformer()),
('clf', OneVsRestClassifier (GaussianNB()))])
classifier.fit(X_train,Y)
predicted = classifier.predict(X_test)
當我使用GaussianNB出現以下錯誤算法:
TypeError: A sparse matrix was passed, but dense data is required. Use X.toarray() to convert to a dense numpy array.
我看到了下面的帖子here
在這篇文章中,創建了一個類來執行數據轉換。 可以使我的代碼適應TfidfTransformer。 我該如何解決這個問題?
非常感謝。是。我試過其他SVM算法和RandomForest,並接受了解析表示 – Blunt
@Blunt沒問題....玩得開心! – omerbp