dplyr

44熱度

6回答

是否可以使用dplyr過濾完整個案的data.frame？當然，complete.cases列出了所有變量的作品。但是，a）當有很多變量時是冗長的，b）當變量名稱未知時（例如，在處理任何數據幀的函數中），不可能。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.%

17熱度

2回答

如何使用dplyr將函數應用於所有非group_by列？

我試圖使用dplyr包的功能應用到一個data.frame所有列未進行分組，其中我會做aggregate()： aggregate(. ~ Species, data = iris, mean) 其中mean被應用到所有列不用於分組。（是的，我知道我可以使用集合，但我想了解dplyr。）我可以使用summarize這樣的： species <- group_by(iris, Species

1熱度

1回答

與ddply

總結字符值我有以下數據框： df <- structure(list(year = c(1986L, 1987L, 1991L, 1991L, 1991L, 1991L, 1992L, 1992L, 1992L, 1992L, 1992L, 1992L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 19

9熱度

2回答

訪問在dplyr

分組數據如何訪問分組數據從dplyr應用GROUP_BY功能和使用％％運營商例如後，如果我想有每個分組數據的第一行，然後我可以做這種使用plyr包作爲 ddply(iris,.(Species),function(df){ df[1,] }) #output # Sepal.Length Sepal.Width Petal.Length Petal.Width Species

3熱度

1回答

使用變量名稱篩選dplyr的tbl_df

我在使用dplyr的tbl_df時分別遇到了常規data.frame問題。我有一個很大的tbl_df（500x30K），需要過濾它。所以我想這樣做是： filter(my.tbl_df, row1>0, row10<0) 這將是類似於 df[df$row1>0 & df$row10<0,] 的偉大工程。但是我需要在運行時動態地構建過濾函數，所以我需要通過一個或多個變量訪問DF/tbl_d

75熱度

4回答

dplyr：「在n錯誤（）：功能不應該被直接稱爲」

我試圖複製在dplyr包的一個例子，但該錯誤消息。我期待看到每個組合的頻率產生的新列n。有人能告訴我我錯過了什麼嗎？我三重檢查了包是否已加載。感謝您的幫助，一如既往。 library(dplyr) # summarise peels off a single layer of grouping by_vs_am <- group_by(mtcars, vs, am) by_vs <- su

2熱度

2回答

dplyr中個體數據的概率

示例：具有多個個人和3個變量的數據框：年（整數），性別（因子：男/女）和聯合（因子：是/否）。我想計算出成爲工會會員的年份和性別的可能性。我通常用aggregate（）來做這件事。我是否一直在這樣做，我正在尋找一種簡單而快速的方式在dplyr中完成它。親切的問候，彼得

38熱度

2回答

dplyr：含空格

df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b" ), row.names = c(NA, -3L), class = "data.frame") 選擇列名和數據的模樣 a a a b 1 1 2 2 2 3 3 3 4 以下調用選擇 select(df, 'a a') 給 Error

0熱度

2回答

使用R中的選擇功能時出錯

我想獲得用戶最常播放的歌曲。這三個領域我想在csv文件是用戶id，songId和playCount但選擇功能給了一個錯誤： write.csv(group_by(mydata,userId) %.% summarise(one=max(playCount)) %.% select(userId,songId,playCount), file="FavouriteSongs.csv") Er

26熱度

1回答

dplyr總結（）與多個返回值從單一功能

我想知道是否有使用功能與summarise（dplyr 0.1.2），即（從psych包實例describe功能）返回多個值的方法。如果不是，它只是因爲它尚未實施，或者是有一個原因，它不會是一個好主意？實施例： require(psych) require(ggplot2) require(dplyr) dgrp <- group_by(diamonds, cut) describe