2015-06-10 91 views
-3

我有賬戶數據記錄(比如唯一的400條記錄)。每個記錄有三個不同的跡象表明溢價。對於每一條記錄,我都關心這些指示如何相互比較。在某些情況下,適應症可能全部相對符合,而在其他3種適應症中則是不穩定的,而且非常不同。這些記錄也有一個與它們相關的狀態。在R中繪製3.1.2

無論如何,我想知道是否有一個很好的方式來可視化3種跡象之間的記錄差異。此外,是否有一種很好的方式來顯示狀態的指示差異(也許在R?中的地圖狀視圖中)。

我已經作圖使用密度圖,其是有幫助的每個單獨的指示的分佈,但在這裏,我詢問的差異可視化 1,2,或所有3個指示爲每個記錄之間。我問的是可能的嗎?

非常感謝。

+1

更多的人將能夠如果您提供樣本數據,可以幫助您。此外,您是否對所有可能的差異感興趣(例如1對2,1對3,2對3)?訂單是否重要? – JasonAizkalns

+1

那麼你的問題是什麼? 「......如果有一種很好的方式來形象化......」?如果是這樣,答案是 - 是的,有一個很好的方法。請發佈示例數據我們可以幫助您更多。 – PoGibas

+0

原諒我,但發佈樣本數據的最佳方式是什麼?另外,@JasonAizkalns,是的,我對所有可能存在的差異感興趣(除非有其他方法可以做到這一點,相關性可能?),順序無關緊要。另外,我認爲適應症之間的差異比標稱差異更有幫助。 – ActuaryGuy

回答

1

也許這樣的事情是你以後,但是這會更容易些,如果你能提供的樣本數據,並在你所要求的具體問題更具描述:

library(ggplot2) 
library(dplyr) 
library(tidyr) 

df <- data.frame(id = 1:400, 
       state = state.abb, 
       ind1 = rnorm(400), 
       ind2 = rnorm(400), 
       ind3 = rnorm(400)) 

df %>% 
    mutate(diff_1_2 = ind1 - ind2, 
     diff_1_3 = ind1 - ind3, 
     diff_2_3 = ind2 - ind3) %>% 
    gather(metric, value, -c(id, state)) %>% 
    filter(metric %in% c("diff_1_2", "diff_1_3", "diff_2_3")) %>% 
    ggplot(., aes(x = metric, y = value)) + 
    geom_boxplot() + 
    facet_wrap(~ state) 
+0

我能夠修改此代碼以獲取我所需要的內容,我是對R來說還是很新的,所以這對我來說是一個很好的學習體驗,非常感謝!但是,我還有一個額外的問題,現在是否可以在每個狀態圖上添加每個給定圖的底層觀察數? – ActuaryGuy