2
我使用Weka的信息增益的屬性選擇功能,我試圖找出Weka在處理連續數據時使用的具體公式。什麼是Weka的InfoGainAttributeEval公式用於評估連續值的熵?
我理解熵的常用公式爲this,因爲數據中的值是離散的。我明白,在處理連續數據時,可以使用微分熵或離散值。我試着看着Weka對InfoGainAttributeEval的解釋,並且已經瀏覽了很多其他的參考資料,但找不到任何東西。
也許它只是我,但誰會知道Weka如何實現這種情況?
謝謝!
這可能有點晚,但非常感謝你的信息和精力!沒有看到Discretize功能。 – eddybear