2017-05-11 43 views
-1

我有一個數據幀,看起來像這樣:如何摺疊數據框中的重複行同時保持NAs?

Community, Sex, Total Pop, Age, Median 
Kodiak,F,NA,NA,3 
Kodiak,F,4,Na,NA 
Kodiak,F,NA,5,NA 
Teru,F,NA,0,NA 
Teru,F,0,NA,NA 

我想崩潰所有的行與普通社會價值的名字。但是,我還想保留NA(我之前做過這個,並且它使得NA成爲0,這是令人困惑的,因爲0具有價值 - 數據是人口普查數據)。我的實際數據框有成千上萬行。

我已經試過:

library(data.table) 
fcensus7 <- fcensus6 %>% 
group_by(Community) %>% 
summarise_each(funs(sum(., na.rm = TRUE))) 

但最終得到這個錯誤(這之前的工作,但也讓我所有的NA的到零):

在summarise_impl錯誤(。數據,點): 參數無效「類型」(字符)

我對R很新。謝謝!

回答

0

它看起來像你有一個「Na」而不是「NA」。您可以嘗試將na = c("", "NA", "Na")添加到您的read_csv函數調用中。

+0

我查了一下,看來它全是NA。它可能是別的嗎?我可以在那裏處理新手,我只需要以某種方式摺疊行。謝謝。 –

+0

@JulietR - 錯誤肯定表明你正在嘗試對'character'數據執行'sum()',因爲它給出了與sum(「a」)'相同的錯誤。對於初學者來說,「性別」不是數字,你正試圖對它進行總結。 – thelatemail

+0

如果我刪除性別列應該工作嗎?編輯:它的工作!這樣的學習曲線,這哈哈謝謝你 –