2012-06-07 76 views
0

重新排序數據,我看到這些代碼從這裏:http://learnr.wordpress.com/2009/08/10/ggplot2-version-of-figures-in-lattice-multivariate-data-visualization-with-r-part-9/要通過hclust R中

hc1 <- hclust(dist(USArrests, method = "canberra")) 
hc1 <- as.dendrogram(hc1) 
ord.hc1 <- order.dendrogram(hc1) 
hc2 <- reorder(hc1, state.region[ord.hc1]) 
ord.hc2 <- order.dendrogram(hc2) 
region.colors <- trellis.par.get("superpose.polygon")$col 
USArrests2 <- melt(t(scale(USArrests))) 
USArrests2$X2 <- factor(USArrests2$X2, levels = state.name[ord.hc2]) 

但我在第四行有關state.region變量很困惑。

訂單的變量是ord.hc1是從USArrests生成的,這似乎與state.region無關。那麼爲什麼它使用state.region重新排序而不是USArrests數據框中的一列?

+1

你能告訴我哪個軟件包有這些數據嗎? – Subs

+0

@Subs,它是'datasets'的一部分:http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/USArrests.html – Ben

+1

和'state.region' is'a factor giving每個國家所屬的地區(東北,南,北中,西)。「比照http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/state.html – Ben

回答

0

看看在state.region幫助文件 -

?state.region 

第一句下詳細,是

R currently contains the following "state" data sets. 
Note that all data are arranged according to alphabetical 
order of the state names. 

這意味着我們可以在美國數據集之間的跳躍,因爲它們是全部在相同的順序,即USArrests的第一個條目的狀態是與state.region中的狀態相同。