我想總結R中的所有觀察項目,但數據包含重複項 ,我不想將它們計爲雙倍;只有一次。每次Emittent應只計爲一項。如何獲得R中的一個子組中的單個值
到目前爲止,我已經嘗試下面的語法 count(Subgroup_2016, vars= c("Emittent"))
我在數據幀中的工作R.
我想總結R中的所有觀察項目,但數據包含重複項 ,我不想將它們計爲雙倍;只有一次。每次Emittent應只計爲一項。如何獲得R中的一個子組中的單個值
到目前爲止,我已經嘗試下面的語法 count(Subgroup_2016, vars= c("Emittent"))
我在數據幀中的工作R.
可能n_distinct
(使用dplyr
),而不是count
你所尋找的是。
例如使用mtcars
內置的數據集:
n_distinct(mtcars$cyl)
# [1] 3
你的情況:
n_distinct(Subgroup_2016$Emittent)
'sum(!duplicated(Subgroup_2016 $ Emittent))' –
是否還有一種方法可以用此公式提取對? n_distinct(Subgroup_2016 $ Emittent&Investor) - 我會建議:n_distinct(DF $ Emittent,DF $ Investor) – Bonsaibubble
'n_distinct(c(Subgroup_2016 $ Emittent,Subgroup_2016 $ Investor))' – LyzandeR
你的問題不是很清楚你想知道不同的價值有多少是「 「Subgroup_2016」'dataframe'的「Emittent」列?如果是這種情況,你只需要做'長度(獨特的(Subgroup_2016 $ Emittent))'。 – Smich7