sequence-analysis

1熱度

1回答

在PST包中，我們使用值C作爲用於修剪樹的信息增益函數的臨界值。該C值，0.05的α的計算方法如下： C95 <- qchisq(0.95, 1)/2 是什麼意思的是，C值是基於0.05的α？這是否意味着我們需要至少95％確定附加節點與以前的節點相比添加了更多信息，才能通過修剪算法保留它？

5熱度

4回答

連續序列數據中的模式

假設我有一個事件列表。例如A, D, T, H, U, A, B, F, H, ...。我需要的是找到完整序列中出現的頻繁模式。在這個問題中，我們不能使用先驗或fp增長等傳統算法，因爲它們需要單獨的項目集。而且，我不能把這個流分成更小的集合。任何想法哪種算法適合我？ EDIT 例如，對於序列A, D, T, H, U, A, D, T, H, T, H, U, A, H, T, H，並用min

1熱度

1回答

seqecmpgroup（）函數的輸出格式？

seqecmpgroup()函數返回一個表，其中包含每個指定組的頻率。但是，當我運行它時，它會產生低於1的頻率（例如0.00035）。我是否應該將這些頻率解釋爲每個子序列出現在多少組中的百分比？下面我粘貼的示例輸出（每個組的頻率被列爲「Freq.1」，「Freq.2」等： Subsequence Support p.value statistic index Freq.1 1 (FA

2熱度

1回答

檢測採用序正則表達式

想象我在列表中有多個字符串是這樣的： [[1]] [1] "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-" [2] "-1-I2-1-TR-1-" [3] "-1-I2-1-FA-1-I3-1-" [4] "-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-" [5] "-1-I2-1-"

3熱度

1回答

TraMineR使用權重

我還是新的TraMineR;因此，我的問題可能對你們大多數人來說非常簡單。我正在使用我的數據處理一些序列圖，並希望用調查權重和名義權重查看結果。我能夠將數據導入到R中，並使用數據運行序列圖，如，但無法使用權重運行它。我已經將我的語法包含在我如何創建狀態序列對象（相當天真）和兩個序列圖示例中。我如何編寫使用權重的語法？謝謝數據文件：DISDATAC; 調查權重：WTSURVY; 標稱權重：N