2017-10-28 64 views
0

爲什麼這個圖沒有顯示出重疊GGPLOT2的MPG數據集 - 如何理解geom_point圖

一些在此數據集中共享汽車x和y(顯示終端和HWY)相同的組合。

  • 例如,對於displ = 2和hwy = 29,有:1 midsize; 6個緊湊型和3個緊湊型。

然而,在這個地方只有一個綠點只顯示1中型。我對這個圖表有什麼誤解?

非常感謝!

ggplot(data = mpg) + 
geom_point(mapping = aes(x = displ, y = hwy, color = class)) 

enter image description here

回答

1

除了抖動,您還可以將geom_point()中的alpha參數更改爲0.3或0.4,默認情況下爲1,這意味着100%不透明。

ggplot(data = mpg) + 
geom_point(mapping = aes(x = displ, y = hwy, color = class, alpha = 0.3)) 

這將突出的過度繪製

2

卡斯滕,

goem_point()電話將地圖座標超過對方,所以你會看到只有一個點,這對於小型數據集更是如此。你可以使用geom_jitter()來解決這個問題,它允許你插入噪音到劇情,讓你看到所有的點。

解決方案:geom_jitter()

這裏我們使用geom_jitter(),插入噪音成積的數據讓我們看到所有的重疊點。

if (require(ggplot2)) install.packages("ggplot2") 
data(mtcars) 
ggplot(data = mpg) + 
    geom_jitter(mapping = aes(x = displ, y = hwy, color = class)) 

疊加輸出:(點稍微偏移來區分每個點)

注意插入的「噪音」如何讓你區分情節點。

enter image description here

NB。抖動幾何是geom_point(position =「jitter」)的便捷捷徑。它爲每個點的位置添加了少量的隨機變化,並且是處理由較小數據集中的離散引起的重疊繪圖的有用方法。

0

的geom_jitter解決方案和alpha變化的解決方案都是很好的地方。第三種可能性是使用geom_count()到標記的大小映射到這些座標觀測次數(與阿爾法調整一起):

library(ggplot2) 
data(mtcars) 
ggplot(data = mpg) + 
    geom_count(mapping = aes(x = displ, y = hwy, color = class), alpha = .5) 
+0

謝謝所有三個這麼多 - 我明白了,我需要做一些基本的ggplot2在詢問這些直截了當的問題之前工作 - ggplot作弊表可能是一個很好的開始概述。再次感謝 – Carsten

相關問題