2013-12-21 37 views
0

我正在使用決策樹進行文本分類,該決策樹使用信息增益作爲文本文檔分類的主要價值。我已經通過TF * IDF值提取了幾個特徵。但我無法弄清楚究竟應該如何計算信息收益?有一些文章提出了這個建議,但他們都不清楚如何將它應用到文本文件。如何查找文本分類中的信息增益?

+0

如果你發現我的答案有幫助,你可以upvote並選擇我的答案 – Ashish

回答

0

您可以使用weka來計算信息增益。在weka InfoGainAttributeEval.java 類會針對文件計算單詞IG。 check this answer這可能會幫助你。

+0

@Subodh Mankar如果有任何問題問我 – Ashish

相關問題