2012-01-30 131 views
3

我正在比較不同的聚類方法,我想查看兩種不同的方法(或參數集)是否定義了相似的聚類。我的羣集被定義爲數據框架中的分類因子(分類變量)。針對另一個分類變量繪製分類變量

如果我使用plot()X是一個分類變量和ÿ是一個連續變量,我得到一個箱線圖。如果我這樣做,但是另一個分類變量,我得到一些奇怪的酒吧陰謀(下圖)。你如何解讀這位情節之王?

plot you get when plotting a categorical variable against another categorical variable

在該圖中,X(DF $類別1)有13個級別:

[1] "A" "B" "C" "D" "cluster1" "cluster5" [7] "cluster2" "cluster8" "cluster0" "cluster6" "cluster4" "cluster3" [13] "cluster7"

ÿ(DF $類別2)只有12個級別:

[1] "A" "B" "C" "D" "cluster5" "cluster0" [7] "cluster4" "cluster2" "cluster3" "cluster6" "cluster1" "cluster7"

A,B,C和D在兩列之間是相同的,其餘的如果集羣不一定與不同集羣運行的結果相同。

編輯:使用的代碼是plot(df$category1, df$category2)

+0

你用什麼樣的代碼來創建它? – 2012-01-30 11:39:27

+0

'plot(df $ category1,df $ category2)' – pedrosaurio 2012-01-30 11:41:05

+0

還描述了你想讓劇情講述的故事。 – 2012-01-30 11:42:37

回答

4

xy是兩個因素,plot電話spineplot。來自該功能幫助頁面的示例:

treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), 
    labels = c("placebo", "treated")) 
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), 
    levels = c(1, 2, 3), 
    labels = c("none", "some", "marked")) 

spineplot(improved, treatment) 

雖然這看起來有點不同於您有的情節。

+1

'spineplot'這就是我想知道的。我想他們看起來並不應該這樣,因爲A,B,C和D的等級在這兩個因素中是相同的。 – pedrosaurio 2012-01-30 12:06:31

+1

謝謝。這完全是谷歌證明!你不可能知道一個x,y的圖,它們都是分類變量,在R中被表示爲* spineplot *。 (除非您反向搜索每個基本繪圖功能的每一頁) – smci 2013-07-11 06:04:31

3

不是你問的,而是嘗試鑲嵌圖()。它會產生一個適用於兩個分類變量的圖形。