0
我想創建兩個數據集,其中一個由2組,這是我用下面的代碼進行彙總數據:R:聚集在第1組和不羣2
x = rnorm(1:100)
g1 = sample(LETTERS[1:3], 100, replace = TRUE)
g2 = sample(LETTERS[24:26], 100, replace = TRUE)
aggregate(x, list(g1, g2), mean)
第二個需要總結數據由第一組而不是第二組。
如果我們考慮從前面的例子可能對:
A - X B - X C - X
A - Y B - Y C - Y
A - Z B - Z C - Z
第二個數據集應數據總結爲平均值的類羣的。
A - not X
A - not Y
A - not Z etc.
有沒有一種方法來操縱R中的聚合函數來實現這一點? 或者我也認爲可能有虛擬變量可以用這種方式表示數據,儘管我不確定它會如何顯示。
我發現這個答案在這裏: R using aggregate to find a function (mean) for "all other"
我認爲這表明每個配對一個虛擬變量是必要的。但是,如果有人能夠提供更好或更有效的方式,那將是值得讚賞的,因爲真實數據集中有許多配對。
在此先感謝
嗨,謝謝你的回答。如果你能解釋你的代碼是如何工作的,那將會很棒。雖然我認爲這不是我正在尋找的。如果結果正確,則應顯示A和Not X =平均值(AY和AZ)。 – SamPassmore
在這種情況下,我修改了它。 –