具有如查找重複子
hello hello hello I am I am I am your string string string string of strings
這樣的一些任意字符串我可以以某種方式找到空間(EDIT)分隔重複子?在這種情況下,它會是'你好','我是'和'串'。
我一直想知道這一段時間,但我仍然找不到任何真正的解決方案。 我也讀過一些關於這個主題的文章,並打到後綴樹上,但是這可以幫助我,儘管我需要找到每個重複例如重複次數高於兩次?
如果是這樣,是否有一些python庫,可以處理後綴樹並對它們執行操作?
編輯:對不起,我不夠清楚。所以只是爲了說清楚 - 我正在尋找重複的子字符串,這意味着字符串中的序列,例如,就正則表達式而言,可以用+或{}通配符替換。所以,如果我將不得不作出從列出的字符串的正則表達式,我會做
(hello){3}(I am){3}your (string){4}of strings
可能重複( http://stackoverflow.com/questions/11090289/find-longest-repetitive-sequence-in-a-string) – fsw
我認爲這樣。在發佈之前,我已經閱讀過這個問題,但我沒有提出任何想法,如何將解決方案轉換爲適合我的問題。 – Jendas
的確,我只關注我真正想要的輸出。對於那個很抱歉。 – Jendas