我有一個問題,我發現自己沒有及時解決問題。真的很感謝任何幫助,因爲我認爲它對於這裏的一些專業人士來說只需幾行代碼。與R的數據處理
我的數據包含了超過2 MIO。交易行。我想對數據做一些關聯規則。
I'm只是感興趣,因爲他們的產品(P_ID) 「PANDORA」 參與和交易(T_ID)那裏,我認識的客戶(C_ID)。我舉了一個例子:
> T_ID <- c(10,10,10,11,12,13,13)
> P_ID <- c("PANDORA", "Others", "Pan","PANDORA","Ham", "PANDORA","Ham")
> c_ID <- c(1,1,1,2,-1,4,4)
> basket <- data.frame(T_ID,P_ID,c_ID)
> basket
T_ID P_ID c_ID
1 10 PANDORA 1
2 10 Others 1
3 10 Pan 1
4 11 PANDORA 2
5 12 Ham -1
6 13 PANDORA 4
7 13 Ham 4
事務10包含產品「Pandora」,因此所有3行應保留在數據集中。雖然交易12沒有附加客戶,但需要將其移除。
林掙扎的最上部分如何保持這是有關含有「PANDORA」同一個事務ID交易行,但有存儲其他產品。
任何幫助非常感謝,
最好的問候, 基督教
解決得很好。謝了哥們! – Christian