2016-01-06 59 views
-3

我有這個表充滿了字符和數字,並希望只有前3頻率,加上自己的變量。根據圖像,我想有結果的表只包括AZ 520,然後AE 488,然後AU 399頂部/最大值在R

Var1 Freq 
1 AE 488 
2 AR 12 
3 AU 399 
4 AW 56 
5 AZ 520 
6 BA 2 
7 BB 84 
8 BG 246 
9 BH 85 
10 BI 6 




as.data.frame(table(training.data.raw$destinationcountry)) 

回答

2

重塑你的數據如下,假設列名,name,並value

training.data.raw <- data_frame(name = c("IN", "IS", "IT", "JO", "JP",  "KZ", "MA", "MZ", "NG", "NO", "NZ", "PE", "PH", "PR", "RO", "RU", "SA", "SE", "SY", "TM", "TN", "TR", "UK", "US", "WS"), 
           value = c(999, 1, 1885, 1098, 2, 584, 858, 11, 10, 522, 193, 29, 2, 1, 1603, 353, 6, 2, 4, 33, 228, 3201, 852, 1363, 1)); 

可以使用top_n功能在dplyr包輕鬆地獲得您想要的結果(在幫助文件?top_n詳細信息):

library(dplyr); 
top_3 <- top_n(x=training.data.raw, n=3); 
top_3; 

編輯基於註釋:如果你有性格的因素,而不是常規的特徵向量,可以先mutate他們的字符:

training.data.characters <- mutate(training.data.raw, name = as.character(name)); 

# Now top_n() will take it 
# Can also explicity state wt argument to tell it to sort by value 
top_3 <- top_n(x=training.data.characters, n=3, wt=value); 
top_3; 
+0

謝謝,但我收到此消息 '錯誤UseMethod(「tbl_vars」): 沒有適用於'tbl_vars'適用於類「factor」類對象的方法 –

+0

好吧,這意味着您的命名變量是'因素'。這是尷尬的。你可以先用'mutate'變換它們。我會更新答案。 –

+0

謝謝!我會檢查出來 –