decision-tree

    3熱度

    1回答

    我正在執行.net中的C4.5 algorithm,但是我不清楚它是如何處理「連續(數字)數據」的。有人能給我更詳細的解釋嗎?

    3熱度

    1回答

    我正在開發一個項目,我需要能夠根據我導入到R的數據集製作一些決策樹。使用rpart包,我想成爲能夠創建一對決策樹,一個使用gini分割標準,另一個使用熵分割標準。如果可能的話,我也希望能夠調整最大樹深度。有人知道怎麼做這個嗎?我非常感謝任何幫助!

    0熱度

    1回答

    圖3(i),(ii),(iii)顯示具有2個數值屬性(x和y軸)和具有兩個類別(圓形和正方形)的目標屬性的訓練集。 我現在想知道數據挖掘算法(最近鄰,樸素貝葉斯和決策樹)解決每個分類問題有多好。 我假設樸素貝葉斯(與天真的假設屬性是不相關的)解決了第二個問題比(i)和更好(III),因爲這裏的數值屬性往往是相互更加獨立。 還有其他想法嗎?謝謝。

    1熱度

    1回答

    我用C++編寫了一個決策樹,使用了一個稍微修改過的版本C4.5 algorithm。每個節點表示數據集的一個屬性或一列,並且每個可能的屬性值都有一個子節點。 我的問題是如何存儲訓練數據集,因爲我必須使用每個節點的子集,所以我需要一種快速方法來只選擇行和列的子集。 主要目標是以儘可能最大的記憶和時間效率(按優先順序)進行。 我認爲最好的方法是有一個數組(或std :: vector)或類似的東西,並

    1熱度

    1回答

    假設我的數據由水果組成,通過它們的顏色和形狀以及具有任意值的更多特徵(紋理尺寸剝離類型等)描述。 我想我的數據適合使用sklearn.tree 如何在sklearn.tree建立一個決策樹決策樹。什麼是樣品和特點,由X定義的數組,什麼是Y. 對於DB我使用MongoDB的,因此數據集在JSON: {"_id":2323, "shape":"round", "color":[red,green],

    12熱度

    2回答

    對不起,我是WEKA新手,剛剛學習。 在我的決策樹(J48)分類輸出,還有一個混淆矩陣: a b <----- classified as 130 8 a = functional 15 150 b = non-functional 如何解讀這個矩陣? & b有什麼區別? 另外,任何人都可以向我解釋什麼是域值?

    10熱度

    1回答

    我做的R.使用軟件rpart分類樹模型由訓練有素的: > tree <- rpart(activity ~ . , data=trainData) > pData1 <- predict(tree, testData, type="class") 此樹模型的精度是: > sum(testData$activity==pData1)/length(pData1) [1] 0.8094276

    2熱度

    1回答

    我在R中使用包rpart創建了一些決策樹。我在我的數據集中有離散變量,如年齡,no.of.children。但由此產生的決策樹有這些變量n小數。這意味着,它被視爲連續變量。 如何避免這種情況,以及如何將這些變量作爲離散的在我的決策樹中使用?

    6熱度

    1回答

    在面試中,我遇到了僱主提出的問題。他問我爲什麼KNN分類器比字母識別或人臉識別中的決策樹快得多? 我當時完全不知道。所以我想知道在哪些方面我應該比較速度性能中的兩種分類方法?謝謝。

    1熱度

    1回答

    我們正在探索在Hadoop集羣上部署Zementis ADAPA或其UPPI插件。我們計劃將SAS模型提取到PMML並進行部署。然而,除了從SAS提取的模型外,我們還需要在PMML中表達更簡單的'模型'/分類規則。 一個例子是: input: var1, var2 rule: var1 >= var2 output: 'true' of 'false' 我目前(在PMML的TreeMode