edit-distance

    18熱度

    4回答

    我只是想知道,如果字符串在兩個字符串之間有Levenshtein距離(或編輯距離),是否有類似的圖? 我的意思是一個標量度量,用於標識將圖形G1轉換爲圖形G2的原子操作數(節點和邊的插入/刪除)。

    11熱度

    1回答

    我想根據2個字符串之間的比較來分配相似性分數。在R中是否有相同的函數?我知道SAS中的這種函數的名稱爲SPEDIS。請讓我知道R中是否有這樣的功能。

    6熱度

    3回答

    我有一個問題,我想匹配數據庫中與給定字符串具有一定編輯距離的所有字符串。 我的想法是生成一個正則表達式,它可以將編輯距離爲d的所有字符串匹配到字符串s。 因此,例如,我想生成d = 1和s = 'abc'的形式正則表達式r:r = 'abc|.abc|.bc|a.c|ab.|abc.'等。但我不確定這是否非常有效,或者是否已經有一些針對該問題的良好算法?我甚至想在編輯距離中考慮字符交換。所以'ac

    0熱度

    1回答

    組我有兩個組字母「AGTE」的字符串和乙,我想找到比較這些,看看他們是否在統計上類似的辦法。第一組A是現實世界觀察,B是預測。每組有400左右例如: **A** GTAATEGTTTEAAA TTEAGE ... **B** AGTEAAAAGT TAT GGATEAATGGGTEAATG .... 我也想在某種程度上將它們想像成爲演示目的。你有什麼想法,我怎麼能做到這一點?

    1熱度

    3回答

    python中是否存在一些考慮口音的編輯距離。 凡爲例持有以下屬性 d('ab', 'ac') > d('àb', 'ab') > 0

    1熱度

    2回答

    我的問題與Algorithm to transform one word to another through valid words相似 但是與主要區別在於,我有一個固定的詞說「詹姆斯」和不同的詞典作爲我/ P。當然,我現在不能預處理字典。 所以我必須找到處理「JAMES」到「JOHNY」以不同詞典作爲輸入的最低成本。 是否有反正我可以預處理單詞「JAMES」,這樣我需要在運行時執行最少數量的編

    -3熱度

    1回答

    我正在尋找不同java程序的源代碼中的相似性/差異。 我已經使用了Levenshtein算法的實現來查找兩個程序的相似程度。 我想知道是否有任何算法可以幫助找到兩個字符串不同的確切位置。

    1熱度

    1回答

    請注意,它並不需要真正計算Levenshtein編輯距離。只是檢查它是否1。 該方法的簽名可以是這樣的: bool Is1EditDistance(string s1, string s2). 例如: 1. 「ABC」 和 「AB」 返回真 2. 「ABC」 和 「aebc」 返回true 3 。「abc」和「a」返回false。 我試過遞歸批准,但它效率不高。 更新:借朋友的回答: for

    3熱度

    1回答

    我已經實現了algorithm by Zhang and Shasha來計算兩棵樹之間的最小編輯距離。一切工作正常,我對目前的運行時間感到非常滿意。 現在我還想生成一個突出顯示更改/刪除/插入節點的差異。根據他們的論文,要求產生計算距離的映射是非常自然的,並且根據最後一張幻燈片this presentation,似乎可以從最後的森林距離表和樹距表中容易地提取映射。不幸的是,我還沒有弄清楚確切的規則

    0熱度

    1回答

    這是一個理論問題,所以我將使用僞代碼。 我有一個對象列表,我需要轉換成另一個列表。 我實現了Levenshtein算法,工作得很好,但我需要保留對象,而不是創建新對象。我可以強制它,但我寧願找一個非O(n * m)的方式來做到這一點。 [OBJ1,OBJ2,OBJ3] - > [OBJ1,OBJ4,obj5,OBJ2,obj6,OBJ3] OBJ1,OBJ2,OBJ3必須其中其餘的新創建的對象相同