2011-07-23 39 views
2

維基百科目前有ID3 algorithm定義,但它是非常複雜的。是否有任何鏈接以易於遵循的方式解釋了這個概念。維基百科有許多複雜的理論和公式。我明白什麼是歸屬。但我不明白什麼是增益。你的基本解釋或指向一些良好的鏈接肯定會幫助我。無法理解ID3算法

感謝提前:)

+1

也許至少包括一個鏈接到維基頁面? –

+0

@Mitch:我認爲這是在google中輸入id3算法的第一個鏈接。不管怎麼說,這就是:通過'http:// en.wikipedia.org /維基/ ID3_algorithm' – TCM

+0

而且我想從這個鏈接引用,但它會在我頭頂的方式:'http://web.arch.usyd.edu .AU /〜wpeng/DecisionTree2.pdf' – TCM

回答

6

我覺得維基頁面基本上指甲的概念,但也有一些例子將是有益的。您可以查看關於此主題的the U Florida pagethe ICL頁面。當涉及到這些主題(機器學習和數據挖掘)時,您應該始終考慮reading materials by Andrew Moore @ CMU,我認爲這對我非常有幫助。

而且,這裏是我的兩分錢:

熵表示包含在消息中的信息(不確定性)的預期值。因爲我們在這裏考慮決策樹,增益是熵的差值,當我們分開的一個屬性(即原來的熵和重均不同分支的熵之間的差)。由於這是減少的不確定性,這只是我們通過分裂這個屬性而獲得的信息。

此外,我們使用的數據挖掘:基於教程,方法,因爲當我們做數據挖掘過程中的文本,一個良好的和容易的書。