sequence-analysis

    1熱度

    1回答

    在PST包中,我們使用值C作爲用於修剪樹的信息增益函數的臨界值。該C值,0.05的α的計算方法如下: C95 <- qchisq(0.95, 1)/2 是什麼意思的是,C值是基於0.05的α?這是否意味着我們需要至少95%確定附加節點與以前的節點相比添加了更多信息,才能通過修剪算法保留它?

    5熱度

    4回答

    假設我有一個事件列表。例如A, D, T, H, U, A, B, F, H, ...。 我需要的是找到完整序列中出現的頻繁模式。在這個問題中,我們不能使用先驗或fp增長等傳統算法,因爲它們需要單獨的項目集。而且,我不能把這個流分成更小的集合。 任何想法哪種算法適合我? EDIT 例如,對於序列A, D, T, H, U, A, D, T, H, T, H, U, A, H, T, H,並用min

    1熱度

    1回答

    seqecmpgroup()函數返回一個表,其中包含每個指定組的頻率。但是,當我運行它時,它會產生低於1的頻率(例如0.00035)。我是否應該將這些頻率解釋爲每個子序列出現在多少組中的百分比? 下面我粘貼的示例輸出(每個組的頻率被列爲「Freq.1」,「Freq.2」等: Subsequence Support p.value statistic index Freq.1 1 (FA

    2熱度

    1回答

    想象我在列表中有多個字符串是這樣的: [[1]] [1] "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-" [2] "-1-I2-1-TR-1-" [3] "-1-I2-1-FA-1-I3-1-" [4] "-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-" [5] "-1-I2-1-"

    3熱度

    1回答

    我還是新的TraMineR;因此,我的問題可能對你們大多數人來說非常簡單。 我正在使用我的數據處理一些序列圖,並希望用調查權重和名義權重查看結果。我能夠將數據導入到R中,並使用數據運行序列圖,如,但無法使用權​​重運行它。我已經將我的語法包含在我如何創建狀態序列對象(相當天真)和兩個序列圖示例中。我如何編寫使用權重的語法?謝謝 數據文件:DISDATAC; 調查權重:WTSURVY; 標稱權重:N