4
我有這樣與熊貓的關聯規則數據幀
df = pd.DataFrame(data=[980,169,104,74], columns=['Count'], index=['X,Y,Z', 'X,Z','X','Y,Z'])
Count
X, Y, Z 980
X,Z 169
X 104
Y,Z 74
我希望能夠從這個提取關聯規則的一個數據幀。我已經看到Apriori算法是參考。並且還發現橙色庫用於數據挖掘在這個領域是衆所周知的。
但問題是,爲了使用AssociationRulesInducer我需要首先創建一個包含所有事務的文件。由於我的數據集非常龐大(20列和5百萬行),將所有這些數據寫入文件並使用Orange重新讀取將會非常昂貴。
您是否知道如何利用當前的數據幀結構來查找關聯規則?
只需添加數據幀代碼即可測試,如果不清楚,請對比一下。 – dooms