dplyr

    44熱度

    6回答

    是否可以使用dplyr過濾完整個案的data.frame?當然,complete.cases列出了所有變量的作品。但是,a)當有很多變量時是冗長的,b)當變量名稱未知時(例如,在處理任何數據幀的函數中),不可能。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.%

    17熱度

    2回答

    我試圖使用dplyr包的功能應用到一個data.frame所有列未進行分組,其中我會做aggregate(): aggregate(. ~ Species, data = iris, mean) 其中mean被應用到所有列不用於分組。 (是的,我知道我可以使用集合,但我想了解dplyr。) 我可以使用summarize這樣的: species <- group_by(iris, Species

    1熱度

    1回答

    總結字符值我有以下數據框: df <- structure(list(year = c(1986L, 1987L, 1991L, 1991L, 1991L, 1991L, 1992L, 1992L, 1992L, 1992L, 1992L, 1992L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L, 19

    9熱度

    2回答

    分組數據如何訪問分組數據從dplyr應用GROUP_BY功能和使用%%運營商 例如後,如果我想有每個分組數據的第一行,然後我可以做這種使用plyr包作爲 ddply(iris,.(Species),function(df){ df[1,] }) #output # Sepal.Length Sepal.Width Petal.Length Petal.Width Species

    3熱度

    1回答

    我在使用dplyr的tbl_df時分別遇到了常規data.frame問題。我有一個很大的tbl_df(500x30K),需要過濾它。 所以我想這樣做是: filter(my.tbl_df, row1>0, row10<0) 這將是類似於 df[df$row1>0 & df$row10<0,] 的偉大工程。但是我需要在運行時動態地構建過濾函數,所以我需要通過一個或多個變量訪問DF/tbl_d

    75熱度

    4回答

    我試圖複製在dplyr包的一個例子,但該錯誤消息。我期待看到每個組合的頻率產生的新列n。有人能告訴我我錯過了什麼嗎?我三重檢查了包是否已加載。感謝您的幫助,一如既往。 library(dplyr) # summarise peels off a single layer of grouping by_vs_am <- group_by(mtcars, vs, am) by_vs <- su

    2熱度

    2回答

    示例:具有多個個人和3個變量的數據框:年(整數),性別(因子:男/女)和聯合(因子:是/否)。我想計算出成爲工會會員的年份和性別的可能性。我通常用aggregate()來做這件事。我是否一直在這樣做,我正在尋找一種簡單而快速的方式在dplyr中完成它。 親切的問候,彼得

    38熱度

    2回答

    df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b" ), row.names = c(NA, -3L), class = "data.frame") 選擇列名和數據的模樣 a a a b 1 1 2 2 2 3 3 3 4 以下調用選擇 select(df, 'a a') 給 Error

    0熱度

    2回答

    我想獲得用戶最常播放的歌曲。這三個領域我想在csv文件是用戶id,songId和playCount但選擇功能給了一個錯誤: write.csv(group_by(mydata,userId) %.% summarise(one=max(playCount)) %.% select(userId,songId,playCount), file="FavouriteSongs.csv") Er

    26熱度

    1回答

    我想知道是否有使用功能與summarise(dplyr 0.1.2),即(從psych包實例describe功能)返回多個值的方法。 如果不是,它只是因爲它尚未實施,或者是有一個原因,它不會是一個好主意? 實施例: require(psych) require(ggplot2) require(dplyr) dgrp <- group_by(diamonds, cut) describe