2012-04-12 59 views
0

我正在尋找一種Java庫,它不僅可以使用ID3或C4.5算法構建決策樹,還可以以某種合適的格式存儲新構建的樹。問題在於,我計劃使用決策樹引擎作爲某種用戶需求推理系統,即在使用培訓數據生成決策樹之後,我想給它輸入(來自用戶的數據)並將輸出用作對用戶的推薦。簡單地說,我只是不能遍歷生成的樹並根據輸入數據集來獲取結果。我還希望不僅構建二元決策樹,還要爲每個父節點構建具有可變數量子元素的樹(這意味着某些節點可能有兩個子元素,其中三個元素都根據父節點中檢查的屬性值)。我剛開始使用決策樹,並沒有太多的經驗。我用谷歌搜索,開始看WEKA,但我不確定它是否滿足我的要求。任何指導都會有很大的幫助。提前致謝!用於生成和使用生成的決策樹的Java庫

回答

0

與weka一起,這是流行的,高性能的,穩定的,有據可查的,人們將能夠幫助你。

1

Weka是最先進的分類工具,包括C4.5。肯定地嘗試一下。實際上,許多其他工具(KNIME,Rapidminer)通常會圍繞Weka進行,主要是做一些數據預處理,用戶界面,實驗運行等,但主要任務是委託給Weka。

在我看來,Weka並不是完全爲此設計的,但它是分類和預測的參考實現。 所以試試吧!當您正在查看其他任務(如聚類或異常檢測)時,請使用其他工具(如ELKI)代替。 Wekas聚類算法很少。

+0

我會definitelly試一試。但是你提到,在你的意見中,WEKA並不是完全爲此設計的。在這種情況下,哪個庫更適合使用? – ferbolg 2012-04-13 20:20:26

+0

我不知道周圍是否有更好的東西。每個人似乎都使用Weka或GNU R進行分類。 – 2012-04-14 05:57:23

+0

還有其他商業軟件包可用。統計是一個。有趣的是,Weka和R都必須在他們的CART決策樹實現中進行折衷,因爲描述CART算法的書保留了算法的一部分祕密。它描述了一個很難解決的算法(如時間),然後說他們實現的實際算法不是這個算法。不是你必須知道的東西,而R和Weka算法在不知道它的情況下表現得足夠好。但是,只是一些有趣的瑣事。 – chubbsondubs 2012-04-25 17:44:59