2010-10-17 60 views
0

這一個星期我試圖找到我的問題的答案,我將不勝感激,如果有人可以提供幫助。 我有一個字符串列表(最初的列表可以看作是字符串列表),我想找到一個模式(這是一個字符串本身)與此列表中的字符串,是否有任何Java庫哪些可以使用或有任何工具(如weka,哪些不這樣做!)哪些可以幫助我?字符串/序列模式挖掘

+0

要完全匹配還是近似匹配? – 2010-10-17 13:22:06

+0

&我應該已經注意到我們沒有任何預定義的模式,我想要檢測一個在列表中重複出現的模式 – 2010-10-17 13:22:16

+0

你的意思是精確的還是近似的? – 2010-10-17 13:22:45

回答

2

聽起來像是你想找到這些字符串的longest common subsequence。這是一個衆所周知的算法問題,通常使用動態編程來解決。有關多種語言的各種實現,請參閱here

0

如果你想找到的模式在一組序列中經常存在的,那麼你可以嘗試「序列模式挖掘」或「連續規則挖掘算法」。

有我SPMF Java open-source data mining library這些算法的幾種實現。