我一直在嘗試自己並在網絡上搜索了一段時間,並且沒有成功。我有一個數據框,它是應用條件和選擇投影的子集,但無法檢索彙總輸出。使用聚合函數來計算數據框架中的輸出
數據幀mydf
:
mydf = list()
mydf = cbind(mydf,
c("New York", "New York", "San Francisco"),
c(4000, 7600, 2500),
c("Bartosz", "Damian", "Maciej"))
mydf = as.data.frame(mydf)
colnames(mydf) = c("city","salary","name")
假設給定的數據幀的一部分,與返回:
subset(mydf, city == "New York", select = c(salary, name))
它會返回一個數據幀,例如:
salary name
9 4000 Bartosz
10 7600 Damian
現在我需要計算從給定的工資a sum
,avg
並選擇與來自上述數據幀,優選地使用一襯墊通過修改上面的代碼至少工資僱員(我猜測這是可能的),以便它返回:
爲sum
:11600
爲avg
:5800
爲至少4000巴爾託什
我試過的東西:(1)
subset(mydf, city == "New York", select = sum(salary))
或(2)
x = subset(mydf, city == "New York", select = salary)
min(x)
和許多組合,其僅產生錯誤說摘要函數僅與所有變量是一個數據幀上定義的數字(2)或相同的輸出作爲第一代碼,而無需sum
(1)
謝謝你解釋爲什麼在這種情況下使用列表來構造數據框是一個不好的選擇。我決定重新整理我的數據框。 –