我幾天來一直在爲我的考試做些工作,而且我正在瀏覽一些過去的論文,但不幸的是沒有相應的答案。我已經回答了這個問題,我想知道如果有人能告訴我我是否正確。數據挖掘和頻繁數據集
我的問題是
(c)一個事務性數據集,T,在下面給出:
T1:牛奶,雞肉,啤酒
T2:雞,奶酪
t3:奶酪,靴子
t4:奶酪,雞肉,啤酒,
T5:雞,啤酒,服裝,奶酪,牛奶
T6:衣服,啤酒,牛奶
T7:啤酒,牛奶,衣服
假設最小支持爲0.5(最小支持度= 0.5 )。 (i)找出所有頻繁項目集。
這裏是我的工作了:
貨品:金額
牛奶:4
雞:4
啤酒:5
奶酪: 4
只靴子:1
衣服:3
現在,因爲最小支持度爲0.5,則您消除靴子和衣服,使剩餘給人一種組合:
{項目}:金額
{牛奶,雞肉}:2
{牛奶,啤酒}:4
{牛奶,奶酪}:1
{雞,啤酒}:3
{雞,奶酪}:3
{啤酒,奶酪}:2
哪隻有牛奶和啤酒作爲唯一的頻繁項目集,那麼它是唯一一個在上面的人?
有兩種以上的算法來解決這個問題。我只會提到其中的一些:Apriori,FPGrowth,Eclat,HMine,DCI,Relim,AIM等。 – Phil