頭(數據)以下哪一個是更好的方法來總結行和創建一個繪圖(融合和轉換,或者tapply並創建一個新的數據框)?
year Emissions
114470 1999 7.38
114472 1999 2.78
114477 1999 11.76
114479 1999 3.50
114481 1999 1.32
114486 1999 5.58
這是海量數據與4年(1999年,2002年,2005年,和2008年)來設置。我想比較一個地塊每年的總排放量。以下兩種方法中的哪一種更好(更好=更適用於其他問題)?在我用ggplot2做了一個情節之後,這就是爲什麼我以第一種方式創建df的原因。
第一種方式
sums <- tapply(data$Emissions, data$year, sum)
df <- data.frame(year = names(sums), pollution = sums, row.names = NULL)
第二種方式
melted_data <- melt(data, id.vars = c("year"))
df2 <- dcast(melted_data, year ~ variable, sum)
他們都有相同的輸出。 df == df2返回TRUE
做到既產生你想要的結果?如果是這樣,那麼「最佳」是什麼意思:最容易支持,最快(在什麼硬件上?),...? – Argalatyr 2014-11-23 01:51:51
對不起,我應該指定。最好=更多功能用於其他問題。如果有必要,我基本上只想記住一個。 – megashigger 2014-11-23 01:59:59
這實在是無法回答,這一切都取決於你正在解決的問題。不知道具體情況,這是一個太寬泛的問題。 – 2014-11-23 08:36:18