我有一個data.frame
看起來類似於此示例:瞭解sunburstR行爲
> head(dd)
# paths counts
#1 s 4735
#2 dt 4635
#3 so 2191
#4 sb 1949
#5 dt-dt 1310
#6 s-s 978
其中一個路徑的不同步驟由-
分開。正如你所看到的,一些路徑長度爲1,有些路徑大於1步(在這個例子中最多5步)。
現在我想使用sunburstR
包將數據可視化爲sunburst
圖。我這樣做:
# devtools::install_github("timelyportfolio/sunburstR")
library(sunburstR)
sunburst(dd)
不幸的是,這不會產生任何輸出,我不明白爲什麼。再舉一個例子,這個按預期工作:
sunburst(tail(dd, 8))
但這並不:
sunburst(tail(dd, 9))
我也注意到,
sunburst(dd[c(5, 1:4),])
產生一個情節,但出人意料的是,dt
類別被分成兩塊,通常應該在第一層(最內層)顯示爲一個塊。
問:有人能向我解釋爲什麼會發生這種情況(有些方法是可行的,有些則沒有,有些工作,但一定程度上顯示了不正確的數據),我需要做的,可視化的整個數據集的內容(更而不僅僅是樣本數據)?
樣本數據
dd <- structure(list(paths = c("s", "dt", "so", "sb", "dt-dt", "s-s",
"so-dt", "dt-dt-dt", "sb-sb", "so-so", "s-s-s", "s-rd", "dt-dt-dt-dt",
"s-sb", "a", "so-dt-dt", "s-rd-rd", "r", "dt-s", "so-sb", "dt-sb",
"s-rd-rd-rd", "dt-rd", "dt-dt-dt-dt-dt", "so-dt-dt-dt"), counts = c(4735L,
4635L, 2191L, 1949L, 1310L, 978L, 558L, 455L, 324L, 281L, 266L,
231L, 208L, 200L, 200L, 196L, 156L, 150L, 142L, 129L, 123L, 114L,
113L, 113L, 100L)), .Names = c("paths", "counts"), class = "data.frame", row.names = c(NA, -25L))
也許是因爲嗆了一倍(子)序列的?例如。 's-rd-rd'是's-rd-rd-rd'的一部分。 – lukeA
@lukeA,謝謝,這可能是真的。我會盡力調查一下。然而,對我的數據至關重要的是,s-rd-rd和s-rd-rd-rd只有前三個等級,但在第四個等級上是不同的,所以我不能將他們統一成一個類別 –
我認爲軟件包的作者在這種情況下追加了一個'-end'。 – lukeA