2017-02-09 152 views
2

我有一個數據框,我目前按照我擁有大約1000個項目的類別進行分組。這創建了一個過寬的圖表,我實際上對大部分數據不感興趣,因爲它們都是相似的。R大提琴組合中的小提琴劇情分爲「其他」類別?

我想要的只是看到高於閾值的項目的最大值的圖表,並可能將所有其他類別組合到「其他」類別中。

有沒有一種罐裝的方式來做到這一點?

回答

1

fct_lump()forcats package可能工作。

您需要首先處理比例值,但其參數prop「保留至少出現在prop的值」(它將其餘的值分組爲「其他」級別)。

另外還有一個n要保留的層數的參數(也將剩餘的其他層分組爲「其他」層)。

這是more information about forcat s。

+0

這對我來說是一個完美的起點。特別是,fct_lump讓我看看我擁有最多數據的那些。不過,我不確定如何看待維度變化最大的維度。你知道這是否可行嗎?並非常感謝! –

+0

另一個變量的最高方差? –

+0

是的。而且我可以用更簡單的方法去處理另一個變量的最大值。 –