我有一個問題,我們可以通過將e.d值除以兩個字符串的長度來規範levenshtein編輯距離嗎? 我在問這個,因爲如果我們比較兩個不等長的字符串,那麼兩者的長度之間的差異也會被計算在內。 例如: ed('has a','has a ball')= 4 and ed('has a','has a ball is is round')= 15 如果我們增加字符串的長度,即使它們相似,編輯距離也會增加。
使用編輯距離我必須找到兩個字符串之間有多少編輯,我已經在下面的代碼中完成了這些編輯,但是im卡住的部分正在打印輸出假設要查看的2d數組像這樣: int editdistance(char *s, int ls, char *t, int lt)
{
int a, b, c;
if (!ls) return lt;
if (!lt) return ls;
我建立一個程序來比較每個促銷碼(可能包含OCR錯誤)在列表中的所有促銷碼在另一份清單(正確的促銷代碼的列表) 預期輸出爲編輯距離以及與正在比較的編輯距離最小的促銷代碼。 我的代碼 import csv
from nltk.metrics import distance
with open("all_correct_promo.csv","rb") as file1:
reader1
我試圖從一組序列中獲得編輯距離的百分比。到目前爲止,這是我: #!/usr/bin/perl -w
use strict;
use Text::Levenshtein qw(distance);
my @sequence = qw(CA--------W----------------------EKDRRTEAF---F------
CA--------W---------------