我的目標是制定有關診斷數據的重要規則。數據集限制尺寸
我預處理我的數據集中沒有稀疏格式;我有116000個實例和28個屬性。 我申請的Apriori算法WEKA所示(使用秧雞資源管理器界面)
Apriori -N 20 -T 1 -C 0.8 -D 0.05 -U 1.0 -M 0.1 -M 0.1 -S -1.0 -c -1
算法似乎需要很長的時間才能完成。 目前超過三個小時即將結束。
是否正常?有一種方法可以加速算法(以其他方式預處理數據,或爲Apriori選擇其他參數)?或者weka不是這個維度的正確工具?
檢查此問題http://stackoverflow.com/questions/15692012/input-arff-file-for-weka-apriori – grubjesic
不幸的是,Weka通常非常緩慢。嘗試A)使用ELKI,SPMF或Christian Borgelt的C實現,而應該快得多,B)FPGrowth算法而不是Apriori。 –