如果我有通用的訂單交易的表[R:如何獲得每個訂單的產品配對數量?
order_id product_id value
1000 A 100
1000 C 55
1000 D 75
1001 B 85
1001 A 35
1001 D 75
1002 B 70
1002 E 20
structure(list(order_id = c(1000L, 1000L, 1000L, 1001L, 1001L,
1001L, 1002L, 1002L), product_id = structure(c(1L, 3L, 4L, 2L,1L, 4L, 2L, 5L),
.Label = c("A", "B", "C", "D", "E"), class = "factor"),
value = c(100L, 55L, 75L, 85L, 35L, 75L, 70L, 20L)), .Names = c("order_id","product_id", "value"),
class = "data.frame", row.names = c(NA, -8L))
我該如何獲得數量和/或平均/累計值的產品配對過ORDER_ID,如:
product_id_one product_id_two count
A B 1
A C 1
A D 2
A E 0
B C 0
B D 1
B E 1
C D 1
C E 0
D E 0
或
product_id_one product_id_two value_average
A B 175
A C 55
A D 142.5
A E 0
B C 0
B D 160
B E 90
C D 130
C E 0
D E 0
除了只是循環它或一些類似的迭代方法?產品ID的順序應該不重要。
是不是3 order_id – akrun
我的目標是統計一個配對出現在唯一順序id中的數量,而不是order_ids本身的數量,即「產品A和B多久一起訂購」 –
我認爲預期產出你根據公認的答案顯示不正確 – akrun