頂部/最大值在R

-3

我有這個表充滿了字符和數字，並希望只有前3頻率，加上自己的變量。根據圖像，我想有結果的表只包括AZ 520，然後AE 488，然後AU 399頂部/最大值在R

Var1 Freq 
1 AE 488 
2 AR 12 
3 AU 399 
4 AW 56 
5 AZ 520 
6 BA 2 
7 BB 84 
8 BG 246 
9 BH 85 
10 BI 6 




as.data.frame(table(training.data.raw$destinationcountry))

來源

2016-01-06 Fadi Gilbert Char

重塑你的數據如下，假設列名，name，並value：

training.data.raw <- data_frame(name = c("IN", "IS", "IT", "JO", "JP",  "KZ", "MA", "MZ", "NG", "NO", "NZ", "PE", "PH", "PR", "RO", "RU", "SA", "SE", "SY", "TM", "TN", "TR", "UK", "US", "WS"), 
           value = c(999, 1, 1885, 1098, 2, 584, 858, 11, 10, 522, 193, 29, 2, 1, 1603, 353, 6, 2, 4, 33, 228, 3201, 852, 1363, 1));

可以使用top_n功能在dplyr包輕鬆地獲得您想要的結果（在幫助文件?top_n詳細信息）：

library(dplyr); 
top_3 <- top_n(x=training.data.raw, n=3); 
top_3;

編輯基於註釋：如果你有性格的因素，而不是常規的特徵向量，可以先mutate他們的字符：

training.data.characters <- mutate(training.data.raw, name = as.character(name)); 

# Now top_n() will take it 
# Can also explicity state wt argument to tell it to sort by value 
top_3 <- top_n(x=training.data.characters, n=3, wt=value); 
top_3;

來源

2016-01-06 15:45:56

謝謝，但我收到此消息 '錯誤UseMethod（「tbl_vars」）：沒有適用於'tbl_vars'適用於類「factor」類對象的方法 –

好吧，這意味着您的命名變量是'因素'。這是尷尬的。你可以先用'mutate'變換它們。我會更新答案。 –

謝謝！我會檢查出來 –

頂部/最大值在R

回答

相關問題