我遇到過很多情況,我想繪製的點數比我真正應該達到的要多 - 主要的缺點是,當我與人分享我的情節或將它們嵌入到論文中時,它們佔據了太多的空間。在數據框中隨機抽樣行非常簡單。R中的最大繪圖點數?
,如果我想爲一個點的情節真正的隨機樣本,可以很容易地說:
ggplot(x,y,data=myDf[sample(1:nrow(myDf),1000),])
不過,我想知道是否有更有效的(理想罐裝)的方式來指定的積點的數量這樣你的實際數據就能準確地反映在情節中。所以這裏是一個例子。 假設我正在繪製諸如重尾分佈的CCDF之類的東西,例如,
ccdf <- function(myList,density=FALSE)
{
# generates the CCDF of a list or vector
freqs = table(myList)
X = rev(as.numeric(names(freqs)))
Y =cumsum(rev(as.list(freqs)));
data.frame(x=X,count=Y)
}
qplot(x,count,data=ccdf(rlnorm(10000,3,2.4)),log='xy')
這將產生y軸變得越來越密的圖。在這裏,爲較大的x或y值繪製較少的樣本是理想的。
有沒有人對處理類似問題有任何提示或建議?
感謝, -e
您好羅布,德克 - 我要澄清的是我不尋找一種方法來處理使用不同可視化方法的重疊繪圖。我特別想做一個情節點,我可以在一個乳膠紙作爲嵌入一個可伸縮矢量圖形。我想這樣做的方式是減少傳達我的數據所需的繪圖點數。 – eytan 2009-12-26 15:18:46
然後子採樣可能是你最好的選擇。當然可以用「非均勻」採樣來完成,所以你可能想從尾部保持更多的點(甚至全部),但能買得起變薄的主要部分顯着。但這看起來有問題,所以你可能不得不自己做飯。 – 2009-12-26 17:37:20