假設我有一個事件列表。例如A, D, T, H, U, A, B, F, H, ...。 我需要的是找到完整序列中出現的頻繁模式。在這個問題中,我們不能使用先驗或fp增長等傳統算法,因爲它們需要單獨的項目集。而且,我不能把這個流分成更小的集合。 任何想法哪種算法適合我? EDIT 例如,對於序列A, D, T, H, U, A, D, T, H, T, H, U, A, H, T, H,並用min
seqecmpgroup()函數返回一個表,其中包含每個指定組的頻率。但是,當我運行它時,它會產生低於1的頻率(例如0.00035)。我是否應該將這些頻率解釋爲每個子序列出現在多少組中的百分比? 下面我粘貼的示例輸出(每個組的頻率被列爲「Freq.1」,「Freq.2」等: Subsequence Support p.value statistic index Freq.1
1 (FA