所以我試圖計算兩個大字符串(大約20-100)之間的距離。 障礙是性能,我需要運行20k距離比較。 (需要數小時)性能問題,編輯大字符串的距離LCP vs Levenshtein vs SIFT
經過調查,我發現了幾個算法,而且我很難決定選擇哪一個。 (基於性能VS準確度)
https://github.com/tdebatty/java-string-similarity - 每個算法的性能列表。
** ** EDITED
- 是SIFT4算法是一個良好的證明/可中繼?
- SIFT4是否是正確的算法?
爲什麼它比基於LCP的/ Levinstein算法快得多?
劑量SIFT也用於圖像處理?或者它是不同的東西?由AMH回答
謝謝。
我不能選擇這個答案。 由於我不清楚,你提供的答案不是我想要問的。 另外我覺得你的答案對這個線程很有價值,所以我投了票。謝謝。 –