回答
一個hexbin情節真實地反映了你的東西(不像散點圖@Roland提出了意見,這很可能只是一個巨大的,緩慢的,BLOB)大約需要3.5秒我的機器上爲您的示例:
set.seed(101)
a<-rnorm(1E7,1,1)
b<-rnorm(1E7,1,1)
library(hexbin)
system.time(plot(hexbin(a,b)))
這是一個重要的觀點:沒有人能夠吸收數百萬甚至數千點的含義(除了那些「藝術」分形圖:-)),所以找到一種方法來聚集或以其他方式減少項目的數量情節。 –
我不知道這個軟件包,你的回答對我在準備的論文中呈現結果的具體問題很有幫助。 +1。然而,問題依然存在:繪圖時什麼是限制?它只是CPU功率還是別的? – Roland
設備驅動程序不能很好地處理這麼大的繪圖任務。繪製單點有很多開銷。這不僅僅是兩個數字,而且需要考慮着色和透明度的能力。這不僅僅是R.當給予具有數百萬個點的圖像來渲染時,PDF觀看者會大大地陷入困境。 –
有你看了tabplot包。它是爲大數據而設計 http://cran.r-project.org/web/packages/tabplot/我使用它比使用hexbin更快(用於overplotting甚至默認的向日葵地塊)
也是我認爲哈德利在http://blog.revolutionanalytics.com/2011/10/ggplot2-for-big-data.html
寫了一篇關於大數據DS的博客修改ggplot東西「」「我目前有工作的另一名學生,月湖,把我們的研究,一個強大的[R包」。「」 2011年10月21日
也許我們可以問哈德利如果更新的ggplot3已準備就緒
一個簡單而快速的方法是設置pch='.'
。性能如下所示
x=rnorm(10^6)
> system.time(plot(x))
user system elapsed
2.87 15.32 18.74
> system.time(plot(x,pch=20))
user system elapsed
3.59 22.20 26.16
> system.time(plot(x,pch='.'))
user system elapsed
1.78 2.26 4.06
- 1. plot()函數默認參數
- 2. 我如何加快Django中的大型數據集的迭代
- 3. Plot大型數據集代表性示例 - Matlab
- 4. 加入大數據表鍵的錶快
- 5. 加入較小的數據集與大型數據集
- 6. 如何在Python中快速加載大型數據集?
- 7. 大數據集
- 8. 快速加載大數據Azure SQL
- 9. 大型數據集
- 10. gnuplot plot標籤數據
- 11. Plot實驗數據分佈
- 12. Core-Plot CPTScatterPlot數據標籤
- 13. plot gmdistribution.fit連同數據
- 14. 快速大數據轉軸
- 15. 使用AngularJS加載大型數據集
- 16. MS Access/SQL加入大型數據集
- 17. 使用ActiveJDBC加載大型數據集
- 18. 流星 - 緩慢加載大數據集
- 19. 加快表值函數
- 20. 修復plot(fevd())函數的佈局
- 21. 錯誤的函數'plot',也許
- 22. 覆蓋數據集函數
- 23. 將大型數據集導入數據庫的最快捷方式是什麼?
- 24. 函數無法在較大的數據集上工作
- 25. Flex中的函數和sortCompareFunction和大型數據集
- 26. 在Android中查詢大型數據集的最快方法
- 27. ANR快速滾動listview與更大的數據集
- 28. 爲數據集集執行lamba函數
- 29. 在處理近乎龐大的數據集時加快QSortFilterProxyModel過濾
- 30. 將黃土曲線添加到大數據集圖的快速方法
總結數據並繪製總結。 – Andrie
我需要直觀地繪製和觀察數據 – SilverSpoon
您可以提供更多關於您正在使用的繪圖功能的信息嗎?無論您是使用基本圖形,點陣還是ggplot,它都會產生很大的差異。 – Andrie