我想用ukkonen的後綴樹來比較文檔。我們如何使用Ukkonen的後綴樹來識別文檔中的所有常見子字符串。 vC++
在這一點上,我就兩件事:
首先,我試圖生成後綴樹的一個文件,然後使用該後綴樹來查找文檔中所有常見的字符串。
接下來是識別兩個文檔之間的所有常見子字符串。
我能夠基於http://marknelson.us/1996/08/01/suffix-trees/爲文檔生成ukkonen後綴樹。並搜索給定的子字符串。 但我仍然無法找到一種方法來識別給定文檔中的所有常見子字符串。 你能告訴我一個方法來做到這一點。我使用visual C++。
我們可以使用ukkonen的算法來比較兩個documetns並確定它們之間的所有常見子字符串嗎?如果是這樣,請一步一步解釋。
有一個在Ukkonen's suffix tree algorithm in plain English?