我有一個user_id - category對的表。用戶可以分爲多個類別。我試圖爲每個可能的結果計算交叉類別。在R或MySQL中創建交叉表
我想結果是這個樣子,顯示計數橫:即誰是A類,也C類用戶等
我的原始數據的結構是這樣的數類別:
怎麼能在這個R或MySQL的實現呢?數據非常大。
這裏的是樣本數據:
data <- structure(list(category = structure(c(1L, 2L, 2L, 1L, 3L, 3L,
2L, 1L, 3L, 2L, 2L, 2L, 3L, 1L, 1L, 3L), .Label = c("A", "B",
"C"), class = "factor"), user_id = c(464L, 345L, 342L, 312L,
345L, 234L, 423L, 464L, 756L, 756L, 345L, 345L, 464L, 345L, 234L,
312L)), .Names = c("category", "user_id"), class = "data.frame", row.names = c(NA,
-16L))
任何代碼段上的方法,函數,或包建議的想法,將不勝感激。謝謝! -John
您能給出樣本數據的預期輸出嗎?我假設它不是第二個數字,因爲它甚至不是對稱的。 – josliber
Hi @josiber,你是對的 - 第二個數字只是結果的一個例子。我無法弄清楚如何得到任何結果,直到找到解決這個問題的辦法。雖然這個功能只是用戶數量。希望有所幫助。 –
既然你已經發布了一個16行的例子,我想你可以手工計算它。請這樣做,併發布預期的輸出結果,因爲在這樣做之前,您沒有可重複的示例。 – josliber