2016-12-30 21 views
1

在閱讀關於TraMIner的文檔時,我發現繪製前10個頻繁發生序列的最簡單方法是使用seqfplot。以下代碼適用於mvad數據集。使用R中的TraMiner繪製20個最低發生序列

library(TraMineR) 
    data("mvad") 
    mvad.labels <- c("employment", "further education", "higher education", 
        "joblessness", "school", "training") 
    mvad.scode <- c("EM", "FE", "HE", "JL", "SC", "TR") 

    mvad.seq <- seqdef(mvad, 17:86, states = mvad.scode, labels = mvad.labels) 

    seqfplot(mvad.seq, withlegend = F, border = NA, title = "Sequence frequency 
    plot") 

我想以類似的方式繪製20個最不頻繁發生的序列。有沒有一種方便的方法來實現這一目標?

回答

3

計算不同序列的號碼,然後使用TLIM繪製最後20

l <- length(seqtab(mvad.seq, tlim = 1:1000)) 

seqfplot(mvad.seq, withlegend = F, border = NA, title = "Sequence frequency 
    plot", tlim=(l-20):l) 

enter image description here

不過,這並沒有真正意義:與大多數數據集,大量的序列將是唯一的,並且將具有1/n的頻率。檢查seqtab(mvad.seq, tlim = 1:1000)的結果。這意味着:

  1. 該圖將顯示具有相同頻率的序列:沒有指示它的點。
  2. 20個「最後」序列可以在許多頻率爲1/n的序列中任意選擇:它們不是最後一個,而是它們的一個子集。