2013-05-15 21 views
-1

我有一些問題,如果任何人都可以提供幫助。 我有一個面板數據,如,例如:ggplot + r面板數據太多數據在圖+交互點+選擇特定變量

Country Name Year GDP PPP HHH 
USA    1960 7  9  10 
Uk    1960 9  10  NA 
World   1960 7  5  3 
Africa   1960 3  7  NA 

幾個問題,請多多包涵。

我使用諸如

ggplot(data, aes(x=Year, y=GDP, colour=Country Name)) + geom_point() 

但有圖有太多的國名(大約150國名),所以一切都是集羣和不可讀GGPLOT2,即使我按過R放大,其太多爲了它。

問題1:如何從上面的ggplot中省略世界和非洲等數據?

問題2:圖表上的點是否可以互動,如果我觸摸了一個點,它會顯示哪個國家?還是有更好的圖形包下載,不,我沒有mathematica。或者我可以爲ggplot指定不同的顏色,但我確實有很多國家需要一次處理。

問題3:如何讓圖形更具可讀性?

問題4:NA值在R中扮演什麼角色,他們是否需要省略?他們是否會造成任何問題?

問題5:我可以添加趨勢線的國家,或者說我只是添加+ geom_line()

問題6:我怎樣才能再添變數,如GDP和PPP +年份和國家的名字嗎?

感謝您的幫助提前

回答

2

Q1:由子集化的data.frame

Q2:link。是的,你可以指定顏色。閱讀文檔。

問題3:通過使用不同類型的圖(散點圖除外)?通過刻畫你的情節?

問題4:ggplot2會自動刪除NA值併發出警告。下次嘗試看看會發生什麼。

問題5:可以。使用geom_smooth(method=lm,se=FALSE)。再次閱讀文檔。

Q6:融化您的data.frame。並使用變量名稱作爲分組變量。這是推薦的方式。你也可以做類似+ geom_point(aes(y=PPP),shape=2)

本網站不鼓勵每個帖子多個問題。在提問之前,您還應該閱讀文檔並做一些基礎研究(搜索網站和網站)。

+0

感謝羅蘭,很大的幫助。虐待將問題保持在最低限度 – ManafQ