2017-07-18 33 views
1

我運行下面的代碼,現在,利用從ML庫分類:星火ML decisiontree分類調用隨機森林方法

val decisionTree = new DecisionTreeClassifier().setLabelCol("label").setFeaturesCol("features").setMaxDepth(7).setImpurity("gini") 
val model = decisionTree.fit(df3) 
val prediction = model.transform(df3) 

當我看着星火歷史,這裏是我所看到的: enter image description here

爲什麼我的單一決策樹使用randomForest方法,我做錯了什麼?而且爲什麼有​​些任務與其他任務相比真的很長? (如果有什麼我可以做,以加快速度,我想知道)

的ML文件中並未給出這麼多的信息.​​..

回答

2

隨機森林決策樹的合奏

所以這和決策樹一樣。 如果您將最大深度從7調整爲1,則需要更少的時間,但您會得到不足的配合。它也是基於RAM的大小。

+0

好吧,它是有道理的。你能否詳細說明公羊的尺寸部分?我不得不改變一些參數,如spark.driver.memory來讓我的程序工作。 – Tiffany

+2

我認爲你應該超過你的執行內存或堆大小。其實這取決於你的模型和解決問題的方式 –

+1

好的,謝謝你,我還發現了setMaxMemoryInMB選項 – Tiffany