我有一個數據集,其座標可以重複多次。 我想使一個hexbinplot顯示該bin中重複座標的最大次數。我使用R,我寧願使用ggplot,因此圖形與同一報告中的其他圖形一致。顯示ggplot2中每個bin的最大頻率點stat_binhex
最低工作示例(垃圾箱顯示計數不是最大):
library(ggplot2)
library(data.table)
set.seed(41)
dat<-data.table(x=sample(seq(-10,10,1),1000,replace=TRUE),
y=sample(seq(-10,10,1),1000,replace=TRUE))
dat[,.N,by=c("x","y")][,max(N)]
# No bin should be over 9
p1 <- ggplot(dat,aes(x=x,y=y))+stat_binhex(bins=10)
p1
我認爲這種方法應該與此有關的問題: calculating percentages for bins in ggplot2 stat_binhex但我不知道如何使它適應我的情況。 此外,我很關心這個問題ggplot2: ..count.. not working with stat_bin_hex anymore,因爲它可以使我的目標比我最初的想法更難。
是否有可能使垃圾箱顯示一個點重複的最大次數?
你能澄清你的意思是「座標重複的最大次數」嗎?我很努力地理解計數和「座標重複次數」之間的區別,並且不知道在這種情況下如何處理「最大」。 –
假設點(0,0)和(0,1)位於同一個容器中,並且它們是該容器中的唯一點。 (0,0)出現5次,(0,1)出現3次。在這種情況下,圖表會顯示8,因爲它使用的函數是計數(5 + 3)。我想使用的是最大功能,因此顯示5(最大(5,3))。 –
感謝@JonNagra的澄清。我已經猜到了,併發布了一些東西,就像你回答。我現在看到*你正在嘗試做什麼,但是我真的爲* why而苦惱 - 這是一個適當的行爲,可能有助於闡明一個不同的解決方案(我很難理解如何僅顯示最大值有助於在丟失大量信息時顯示數據,並從查看器中隱藏該信息)。或者,下面我發佈了一個選項來分別顯示所有的座標。 –