suffix-array

    1熱度

    1回答

    如何修改Ukkonen's paper中的過程以保存單詞在文本中出現的次數值。有沒有提供字符串頻率的這樣的實現? 我想要的修改就像是一個字符串「嘿嘿」所有「h」,「e」,「他」在樹中應該是2的頻率計數。其餘節點的默認值爲1. 我發現了一些圖書館,如the best so far和以前的一些問題,如this。 但他們都沒有描述一個足夠好的解決方案來解決我的問題。另外我必須處理一個非常大的字典文件(大

    4熱度

    1回答

    輸入:兩個字符串A和B. 輸出:一組重複的,非重疊的子串 我必須找到的所有重複的字符串,每個字符串必須在兩個(!)字符串中至少出現一次。例如,讓 A =「xyabcxeeeyeyabczeee」和B =「yxabcxabee」。 然後一個有效的輸出是{「ABCX」,「AB」,「EE」},而不是「EEE」,因爲它僅發生在串A. 我覺得這個問題是非常相關「超級重複」問題。下面是一個定義: 最大重複對:

    1熱度

    1回答

    我想通過qsort()排序字符串的後綴,但沒有得到排序列表。 我該怎麼辦? 這裏是我做了什麼: char str[MAXN]="banana", *a[MAXN]; for(i=0;i<strlen(str);i++) a[i]=&str[i]; //a[] points to suffixes starting qsort(a, n, sizeof(char *), compa

    3熱度

    1回答

    我需要一個後綴樹Java實現。我在some googling之後得出結論,the libdivsufsort C implementation是最好的一個。是否有相同(或幾乎一樣好)質量的Java實現,並且最好是開源的。實施應該是生產代碼,而不是概念代碼的證明。

    1熱度

    1回答

    我正在讀關於DC3的文章來構造後綴數組。 我想知道爲什麼DC3不能作爲DC2應用,以便計算速度更快?

    4熱度

    2回答

    我編寫了一個後綴數組實現,並在我的實現中發現了一個問題。具體我已經輸出的第一少數後綴數組居此string的RA[0..7](長度= 10^5)並具有下面的輸出: 80994 84360 87854 91517 95320 99277 83068 但是正確的一個必須是(一切由23移位): 81017 84383 87877 91540 95343 99300 83091

    1熱度

    1回答

    我使用this program來計算後綴數組和最長公用前綴。 我需要計算兩個字符串之間最長的公共子串。 爲此,我連接字符串,A#B,然後使用this algorithm。我有後綴數組sa[]和LCP[]數組。 最長的公共子串是最大值LCP[]數組。 爲了找到子字符串,唯一的條件是在通用長度的子字符串中,第一次出現在字符串B中的那個應該是答案。 爲此,我保持LCP []的最大值。如果LCP[curr

    1熱度

    1回答

    如何計算後綴數組的LCP數組?它不一定是最高效的。 O(n log n)或O(n)會做。如果可能,相對容易編碼。

    3熱度

    1回答

    我試圖通過理論在紙張http://webglimpse.net/pubs/suffix.pdf 去,但我有點失去了當他們說 讓艾是在第一個桶中的第一個SUF網絡X(即Pos [0] = i),並考慮Ai-h(如果ih爲< 0,那麼我們忽略Ai並且取Pos [1]的後綴,等等)。由於Ai以最小的h符號字符串開始,因此Ai-h應該是第一個2h桶。 我無法理解這種說法。爲什麼Ai-h可以忽略如果i-h

    0熱度

    1回答

    cocos2d通過類似「@ 2x」的方式爲通常的iOS應用程序添加後綴。我也想把這些圖片放入一個spritesheet。 問題是一個默認的cocos2d spritesheet表示爲一個PNG和一個plist文件與精靈幀。 那麼如何強制cocos2d引擎在必要時將這些後綴應用於plist文件?