2016-03-05 24 views
0

我有一個關於1960年至2014年間在不同國家進行的調查的統一數據集。我想放棄同一年在同一個國家進行過兩次不同調查的行。我不確定如何在dplyr中使用過濾器動詞從協調數據集中刪除行。使用dplyr過濾數據框中的行

Harm_data1 %>% 
group_by(country, survey, year, protest demo , protest fact) %>% 
filter(country >= 2 | year >=2) 
+1

'Harm_data1%>%GROUP_BY(國家,年)%>%的過濾器(N()== 1)' – alistaire

回答

1

你是說你想要輸出到一個新表?我相信你上面的話會給出與你所要求的完全相反的東西,它只會返回那些更大的東西。我會做:

Harm_data1 %>% 
group_by(country, survey, year, protest demo , protest fact) %>% 
filter(country < 2 | year < 2) 
+1

鑑於國家通常不作爲數字存儲和多年通常大於1,這可能會返回一個空集。您需要計算每個組的行數。 – alistaire

+0

完全贊同,我誤解了一段。 – ike

+0

國家不是以我認爲是問題的數字進行存儲,而是可以使用dplyr中的計數或獨特函數作爲條件,以便在同一年內出現多次的國家/地區的結果。 ?將不勝感激任何幫助:) – neozback