我試圖根據二次數據計數規範一個數據條形圖。
例如,在data.frame數據開始下表:R/ggplot2:標準化二次數據計數條形圖
ID Classification
1 neutral
1 low
2 medium
2 high
2 high
3 neutral
3 neutral
4 medium
4 low
5 medium
所得barplot將具有x軸杆「中性」,「低」,「中」,和「高」,與y軸高度由分類計數除以分類中唯一ID的計數確定。即:
neutral = 3/2
low = 2/2
medium = 3/3
high = 2/1
我知道,這樣做只是計數以下工作:
levels(data$Classification) <- c("neutral", "low", "medium", "high")
qplot(Classification, fill = Classification, data = data, geom = "bar") + guides(fill = FALSE)
但我不知所措試圖找出如何爲我所描述的標準化數據。
感謝您的幫助!
「正常化」是什麼意思? – dickoa
通過「正常化」,你的意思是你想要得到一個概率分佈嗎? –
你應該將它稱爲「正常化」以外的東西,因爲它不會執行通常稱爲「正常化」的兩種操作之一。 –