0
重新排序數據,我看到這些代碼從這裏:http://learnr.wordpress.com/2009/08/10/ggplot2-version-of-figures-in-lattice-multivariate-data-visualization-with-r-part-9/要通過hclust R中
hc1 <- hclust(dist(USArrests, method = "canberra"))
hc1 <- as.dendrogram(hc1)
ord.hc1 <- order.dendrogram(hc1)
hc2 <- reorder(hc1, state.region[ord.hc1])
ord.hc2 <- order.dendrogram(hc2)
region.colors <- trellis.par.get("superpose.polygon")$col
USArrests2 <- melt(t(scale(USArrests)))
USArrests2$X2 <- factor(USArrests2$X2, levels = state.name[ord.hc2])
但我在第四行有關state.region
變量很困惑。
訂單的變量是ord.hc1
是從USArrests
生成的,這似乎與state.region
無關。那麼爲什麼它使用state.region
重新排序而不是USArrests
數據框中的一列?
你能告訴我哪個軟件包有這些數據嗎? – Subs
@Subs,它是'datasets'的一部分:http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/USArrests.html – Ben
和'state.region' is'a factor giving每個國家所屬的地區(東北,南,北中,西)。「比照http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/state.html – Ben