如何在R中對單詞(非字符)Level進行Levenshtein距離測量?句級R中的Levenshtein距離
參見以下:
預期結果1)
# levenshtein operations needed: Delete*2 --> 2 operations
array1 <- c("word", "car")
array2 <- c("word", "pool", "beer", "car")
我正在尋求的功能levenshtein()
,從而返回上面的例子中的2的距離:
levenshtein(array1, array2)
--> 2
預期成果2)
# levenshtein operations needed: Delete and insert --> 2 operations
array1 <- c("word", "car", "pool")
array2 <- c("word", "pool", "car")
我正在尋找一個功能levenshtein()
,從而返回上面的例子中的2的距離:
levenshtein(array1, array2)
--> 2
我發現: Word-level edit distance of a sentence 但我沒有找到工作尼德曼 - 翁施implentation國債收益率預期的結果,如上所述。
喜卡爾,感謝您的答覆。我不確定你的答案是否會返回兩個例子的距離?如果不清楚,我會對該示例進行編輯。 – ThanksGuys
我不明白你在問我在想什麼。你是否正在尋找array2中所有出現的組合編輯距離爲2的事件,例如'insertions + deletions = 2'?這裏的實際目標是什麼?按照計劃@ThanksGuys? –