2017-06-21 186 views
0

我有一個包含交易數據的數據框。每行代表一個交易,列表示一個產品是否從一個類別購買(類別是A-F)或不是(一個=是,零=否)。現在我想計算每個類別內的交易對。我的數據幀如下所示:在python中用熊貓購物籃分析

A B C D E F 
1 1 0 0 0 0 
1 0 1 1 0 0 

輸出應該是一個矩陣計數類別中的各對在數據幀像這樣:

A B C D E F 
A 4 2 1 0 4 2 
B 5 6 7 3 5 1 
C 1 6 5 8 7 9 
D ... 
E ... 
F ... 

任何人都知道如何解決這個問題的解決方案?

非常感謝!

回答

3

使用點產品,它的轉置:

df.T.dot(df) 
Out: 
    A B C D E F 
A 2 1 1 1 0 0 
B 1 1 0 0 0 0 
C 1 0 1 1 0 0 
D 1 0 1 1 0 0 
E 0 0 0 0 0 0 
F 0 0 0 0 0 0 

注意尋找成對出現的不可擴展,雖然。你可能想看看apriori algorithm