2015-08-13 61 views
0

我試圖在Weka中應用Apriori算法。
維基百科具有用於一個簡單的例子(Apriori algorithm):在Weka中的Apriori算法中獲取頻率

alpha beta epsilon 
alpha beta theta 
alpha beta epsilon 
alpha beta theta 

以下關聯規則可從該表來確定:與alpha

  • 100%還含有beta
  • 50 %的套與alpha,測試版也有epsilon
  • 50%套與alpha,測試版所以有theta

我轉換這個項目分成CSV並添加另一個屬性行,讓我終於有了這個文件:

prod1,prod2,prod3 
alpha,beta,epsilon 
alpha,beta,theta 
alpha,beta,epsilon 
alpha,beta,theta 

我裝成Weka中,並點擊標籤「助理」,默認情況下選擇「Apriori」算法。

結果我得到如下:

1. prod2=beta 4 ==> prod1=alpha 4 conf:(1) 
2. prod1=alpha 4 ==> prod2=beta 4 conf:(1) 
3. prod3=epsilon 2 ==> prod1=alpha 2 conf:(1) 
4. prod3=theta 2 ==> prod1=alpha 2 conf:(1) 
5. prod3=epsilon 2 ==> prod2=beta 2 conf:(1) 
6. prod3=theta 2 ==> prod2=beta 2 conf:(1) 
7. prod2=beta prod3=epsilon 2 ==> prod1=alpha 2 conf:(1) 
8. prod1=alpha prod3=epsilon 2 ==> prod2=beta 2 conf:(1) 
9. prod3=epsilon 2 ==> prod1=alpha prod2=beta 2 conf:(1) 
10. prod2=beta prod3=theta 2 ==> prod1=alpha 2 conf:(1) 

但我也希望頻率在維基百科(見上文)的例子。

回答

1

Weka給你的信心(conf:(1))正是你想要的「頻率」。

正如你所看到的,你的規則「50%的集合與alpha,beta也有epsilon」不在Weka的輸出中。這是因爲Weka列出按降序排列的按置信度排序的規則。因此,要列出您的50%規則,您需要增加Weka輸出的數量。

這可以通過增加「numRules」(默認值爲10,參見下面的截圖)來完成。對於您的特定示例,您還需要將「minMetric」從0.9降至0.5(或更低)。

Weka GUI Apriori parameters