2012-03-22 29 views
1

我有經驗對付神經網絡中,向後傳播的性質,具體的,我知道的傳遞給教練的輸入,輸入之間的依賴關係的一部分在引入隱藏層時所得到的模型知識。做了決策網絡/決策林考慮到輸入之間的客戶關係

是對決策網絡同樣如此?

我發現,圍繞這些算法(ID3)等稍硬的信息來找到。我已經能夠找到實際的算法,但預期/最佳數據集格式和其他概覽等信息很少見。

謝謝。

回答

0

決策樹其實很容易提供的數據,因爲他們需要的是數據表,以及列指出數據什麼功能(或列)要預測上的。該數據對於任何功能可以是離散的或連續的。現在有幾種類型的決策樹對連續和離散值有不同的支持。而且他們的工作方式不同,因此瞭解每個人的工作方式可能具有挑戰性

Different decision tree algorithms with comparison of complexity or performance

根據算法的你有興趣也可以是很難找到信息,而不讀取實際的文件,如果你想嘗試和實現它的類型。我已經實現了CART算法,唯一的選擇是找到關於它的原始200頁的書。大多數其他的治療方法只討論像分裂的細節,但沒有討論任何其他方面的問題。

至於他們是否考慮到事物之間的依賴關係。我相信它只是假定每個輸入特徵和預測特徵之間的依賴關係。如果輸入與預測功能無關,則不能將其用作拆分條件。但是,在其他輸入功能之間,我相信它們必須是相互獨立的。我不得不檢查一下這本書,以確保這是真實的或不真實的,但我的頭頂我認爲這是事實。

+0

感謝您的回答。我認爲一種方法可能是修改算法以獲取輸入值之間的關係,並將計算作爲附加輸入值使用。這將基本上對輸入到樹中的輸入數量進行平方,但也許可能會暴露數據點與輸出之間的一些附加關聯。 – 2012-05-03 09:38:05

+0

獨特的CART算法的一件事是其二叉樹。分裂總是分裂成兩個分支。但它可以選擇使用代理拆分來分割多個值和多個特徵。您可能想要研究CART中的代理人分裂問題,因爲它一次會分割多個功能。對輸入進行平方處理將會非常昂貴,因爲在對需要優化的分類特徵進行分割時,CART已經具有O(n!)算法。並且平方意味着只有在兩個特徵之間有什麼關係纔是4,5或6? – chubbsondubs 2012-05-03 14:35:54

+0

我認爲最終你會試圖找到我認爲使用代理分裂來討論的特徵之間的依賴關係。從兩個特徵的關係中,你會發現其中一個分裂支配另一個特徵,但是你可以考慮第二,第三等對分裂有多大貢獻的閾值。 – chubbsondubs 2012-05-03 14:40:30