summarize

    1熱度

    1回答

    的樣本數據: df <- data.frame(HELP = c("Yes", "Yes", "Yes", "No", "Yes", "No")) 我所做的: cdata <- ddply(df, c("HELP"), summarise, Total = sum(df$HELP == 'No'), Probability = Total/nrow(df) )

    0熱度

    1回答

    當更新到最新版本的包dplyr時,我已經使用NSE的功能被破壞了。我想知道新版本如何改變這個以及如何解決它。我試過在每個變量名前使用.data$和.env$,但似乎無法使其工作。 這裏是我的自定義函數: t_ppond <- function(w, v){ arguments <- as.list(match.call()) y <- eval(arguments$w)

    -2熱度

    2回答

    summarize命令在Stata中創建各種標量。例如,之後可以通過gen mean=r(mean)存儲平均值或最小/最大值。 也可以通過summarize varname, detail選項獲得更復雜的度量。通過這個,還可以獲得以百分之50的百分比形式的中位數。 我的目標是存儲的中位數。是否有相應的標量? 從哪裏可以獲得標準操作後存儲的標量信息,如summarize?據我所知,他們沒有在Stat

    0熱度

    1回答

    我有一個列表中的所有數據幀都具有相同的結構 - 在本例中爲變量a,b和c。現在我想總結整個列表中值的方法。 # list of 10 random data frames n <- 1e1 initSeed <- 1234 set.seed(initSeed) (seedVec <- sample.int(n = 1e3, size = n, replace = FALSE)) lst

    2熱度

    2回答

    我正在尋找一種操作數據框內多個變量的有效方法。現在我正在使用dplyr,但是這對於更多的變量來說很麻煩。 假設我有以下數據框,其中brd是汽車品牌,ye是一年,type是汽車類型,cy和hp是類型特徵。 brd <-c("BMW","BMW","BMW","Volvo","Volvo", "Volvo","BMW","BMW","BMW","Volvo","Volvo","Volvo") ye

    0熱度

    1回答

    我被給了一組特別混亂的數據。其中有三列表示相同的因子變量 - 焦點1,焦點2和焦點3,其中每個數據觀測可能包含多個焦點,但它們不是量度的量度,即焦點1給出的焦點不一定是更強的焦點比焦點2。我需要將這三個變量擴展爲綜合重點變量的每個可能級別的指標變量。要做到這一點,我使用了下面的代碼,昨天我的個人電腦上完美運行,但我在辦公室的一臺Mac上工作,現在我遇到了問題。 # Create focus var

    1熱度

    2回答

    我有一個數據集,其中包含按出口每週銷售各種產品的數據集。下面是數據看起來的樣子: Store ID Week ID Item Code Sales in $ 253422 191 41130 2.95 272568 188 41130 2.95 272568 188 41160 2.95 272568 189 41130 2.95 272568 189 41160 2.95 27256

    1熱度

    1回答

    我有一個由3個位置值(XYZ)和3個旋轉值(歐米茄,Phi,Kappa)組成的數據集。 頭(pos.df)看起來像這樣 Batch PhotoID X Y Z Omega Phi Kappa 1 1 DSC_7120 -269.6995 -359.33126 2390.522 -2.78643779 0.03288689 49.42041 2 1 DSC_7121 -32

    1熱度

    2回答

    我想創建一個分組摘要,報告每個組中的記錄數,然後顯示一系列變量的含義。 我只能研究如何做到這兩個單獨的總結,然後我將它們連接在一起。這工作正常,但我想知道是否有一個更優雅的方式來做到這一點? dailyn<-daily %>% # this summarises n group_by(type) %>% summarise(n=n()) %>% dailymeans <-

    2熱度

    1回答

    我想輸出分組的摘要變量和相應的標識變量列表。 以dplyr::starwars數據集爲例,我想根據性別來計算具有「輕」膚色的字符數,其中每個匹配的名稱向量位於單獨的輸出列中。 在現實世界的使用案例中,會有多個條件到summarise,唯一標識符可能是subjectID/studyID/etc。我對data.table解決方案持開放態度,喜歡基於矢量的解決方案,R Shiny友好,可輕鬆轉換爲功能。