2017-10-06 43 views
1

所以我有以下數據看起來像這樣(它的樣本,在一個跨度約15年的數百行)。我想創建一個列(或彙總表),顯示每個位置的可用數據年限。如何創建一個列或數據摘要表,其中列出了某個值的可用年數?

Year, Place 
2000, 'Adak' 
2000, 'Kodiak' 
2000, 'Saltsdale' 
2001, 'Adak' 
2001, 'Saltsdale' 
2001, 'Tawney' 
2002, 'Adak' 
2002, 'Kodiak' 
2002, 'Tawney' 

我真的很喜歡它看起來像這樣如果可能的話:

Place, Years_Available 
'Adak', 2000/2002 
'Kodiak', 2000/2002 
'Saltsdale', 2000/2001 
'Tawney', 2001/2002 

我已經summarize_all使用,但它給了我一個奇怪的輸出,其中Years_Available列只是在重複第一年的15倍。

b1 <- b %>% 
    group_by(Place) %>% 
    mutate(years = toString(Year)) %>% 
    group_by(Place,years) %>% 
    summarize_all(funs(sum(!is.na(.)))) 

回答

1

我們可以使用range

df1 %>% 
    group_by(Place) %>% 
    summarise(Year = toString(range(Year))) 
+0

當我將此更大的數據集,我會得到相同的範圍(第一年至去年)的每一個地方,這是不準確的不幸。 –

+0

@JulietR你可以檢查你的'年份'列是字符串還是數字? – akrun

相關問題