在R中的aRules包中,我怎麼能有效地找到關閉關聯規則?即具有封閉LHS項目集的規則R aRules:查找封閉關聯規則
如果添加任何項目會減少支持,則項目集關閉。
的包提供以下采礦選項:
目標:指示關聯的開採的類型的字符串。 一個
- 「頻繁項集」
- 「最大頻繁項集」
- 「閉頻繁項集」
- 「規則」(僅適用於先驗)
- 「hyperedgesets」(僅適用對於Apriori;參見定義關聯•超定值)
似乎沒有「封閉規則」選項。有兩個明顯的變通辦法:
礦規則和封閉項集
rules = apriori(data, parameter=list(target="rules"))) rules <- rules[is.closed(generatingItemsets(rules))]
這可以說是相當緩慢的應用過濾器。例如,對於10k項目的5k交易,aPriori在10秒內生成8M規則。關閉過濾器花費了大約20分鐘,導致約3萬個關閉規則。
- 煤礦關閉頻繁項集和關聯應用過濾器(置信度,提升等)
尚未實現,但它似乎是一個周圍實現的東西很多方式簡單。如果有人知道其他的實現(其他R包或甚至R之外的東西),可以這樣做,指針會非常有幫助。例如, The SPMF library似乎已經對它的支持,想知道是否有人使用它
SPMF庫提供了Java中封閉關聯規則挖掘的快速實現以及許多關聯規則挖掘的其他算法。你可以檢查包裝從R調用SPMF庫(https://github.com/pommedeterresautee/spmf)。 – Phil