我有以下形式的數據集:計算基於多個變量的數據子集的平均值(每一個組合)
object.type condition date replicate value
object1 condition1 17/2/2014 1 5000
object1 condition1 17/2/2014 2 6000
object1 condition1 18/2/2014 1 5500
object1 condition1 18/2/2014 2 6300
object1 condition2 17/2/2014 1 5000
object1 condition2 17/2/2014 2 6000
object1 condition2 18/2/2014 1 5500
object1 condition2 18/2/2014 2 6300
object2 condition1 17/2/2014 1 5000
object2 condition1 17/2/2014 2 6000
object2 condition1 18/2/2014 1 5500
object2 condition1 18/2/2014 2 6300
etc.
我想要做的是計算的子集的平均一定的條件下某個對象在某個日期。因此,例如,對於object1,在condition1中的17日,值將是mean(c(5000, 5500))
。因此,在最後,我結束了這樣的data.frame:
object.type condition date value
object1 condition1 17/2/2014 5250
object1 condition1 18/2/2014 6150
object1 condition2 17/2/2014 5250
object1 condition2 18/2/2014 6150
object2 condition1 17/2/2014 5250
etc.
我能穿過各級對象類型,通過條件各級循環,循環的各個層面做到這一點使用嵌套循環(循環的日期),但我是R新手,我學到的是矢量化是解決這些問題的最佳方法。我似乎無法弄清楚我將如何去做。有什麼功能可以在這裏幫助嗎?還是一種整潔的方法,而不是使用三個嵌套for循環,而這些循環需要迭代(並且低效地)擴展數據框?
看看?聚合 – Aashu
請幫我理解:看一個t頂部的樣本數據集,對於object1,condition1,date = 17/2/2014,平均值5000和6000 = 5250是多少? – jlhoward
@jlhoward啊,我知道我會在那裏滑倒,但我沒想到有人真的看着哈哈。發現得好。 – DashAnimal