2016-04-23 36 views
1

我一直在我的推文數據集上運行邏輯迴歸,神經網絡,樸素貝葉斯和支持向量機模型。我正在做一個情緒分析,其中R預測文本是否是來自訓練數據的正面,中性或負面。Logistic迴歸Varimp總是與其他模型不同; Text Analytics R

我注意到,對於神經網絡,樸素貝葉斯和SVM,varImp總是相同的。然而,邏輯迴歸具有非常不同的變量重要性的變量。我只是好奇,爲什麼呢?邏輯迴歸不是用於文本分析的好模型嗎?還是有時適合使用?

+1

我會建議發佈您的問題到[交叉驗證](http://stats.stackexchange.com/)。 –

回答

0

由於結果變量(即情感類)中有樹類(正面,中性和負面),因此不能直接使用僅適用於二元結果的邏輯迴歸模型。其他模型,如神經網絡,樸素貝葉斯和SVM可以直接處理超過2類的結果變量。由於模型規範在邏輯迴歸和其他模型之間存在根本差異,因此變量重要性不同也就不足爲奇了。