2015-11-11 30 views
4

我有這樣與熊貓的關聯規則數據幀

df = pd.DataFrame(data=[980,169,104,74], columns=['Count'], index=['X,Y,Z', 'X,Z','X','Y,Z']) 

      Count 
X, Y, Z  980 
X,Z   169 
X   104 
Y,Z   74 

我希望能夠從這個提取關聯規則的一個數據幀。我已經看到Apriori算法是參考。並且還發現橙色庫用於數據挖掘在這個領域是衆所周知的。

但問題是,爲了使用AssociationRulesInducer我需要首先創建一個包含所有事務的文件。由於我的數據集非常龐大(20列和5百萬行),將所有這些數據寫入文件並使用Orange重新讀取將會非常昂貴。

您是否知道如何利用當前的數據幀結構來查找關聯規則?

+0

只需添加數據幀代碼即可測試,如果不清楚,請對比一下。 – dooms

回答