2012-10-15 45 views

回答

0

我會考慮將屬性選擇的迭代作爲一個MapReduce作業的方法。遵循這個想法,您可以爲每個映射器分配屬性以檢查信息增益,並且在縮小階段(使用單個縮減器)可以選擇最佳屬性。
如果計算一臺機器上的單次迭代(在所有屬性上)的計算時間稍長一些,那麼工作開始時間開始時間大約爲20-40秒,我認爲這種方法很實用。