0
我有一個數據集(CSV文件)使用Apriori算法找到頻繁項目集。如何查找頻繁的項目集而不考慮屬性名稱?
col1, col2, col3
bread, butter,?
coke, bread, butter
我爲此使用WEKA。在輸出中是按以下格式:
...
Large Itemsets L(2):
col1=bread col2= butter 1
col1=coke col2= bread 1
col1=coke col3= butter 1
col2= bread col3= butter 1
...
但我是想輸出是:
bread, butter 2
基本上,上面的輸出是獨立的,他們屬於col
的。我怎樣才能達到這種輸出?