我正在運行NaiveBayes模型進行文本分析,其中包含大約2000多個變量和30000多個觀察值。這是非常稀疏的數據,但沒有任何零或不變的列。使用klaR的錯誤NaiveBayes
model <- NaiveBayes(nation~., data=data_train)
我越來越:
"Zero variances for at least one class in variables: "
和50個變量的列表。 該錯誤類似於下面的錯誤,但是我的類變量是一個因素。 https://stats.stackexchange.com/questions/35694/naive-bayes-fails-with-a-perfect-predictor。
我也在相同的數據上運行e1071的樸素貝葉斯。它運行,但準確性低得可笑(7%)。我用SVM得到了85%。 有什麼建議嗎? 謝謝。