我正在使用Levenshtein距離,它是一個字符串度量,用於測量兩個序列之間的差異量以找出兩個字符串之間的差異百分比。我想使用更好的方法來聲明字符串與字符串中的單詞相似。比較2個字符串以查找它們是否包含與java相同的單詞
例如:可以說我有一個2段的字符串,第二個字符串只包含第一個字符串的第二段。
我知道我可以比較每個字符串的第一個單詞,然後是第二個等,但如果像我提出的最後一個例子發生的情況下,這將不會有效。
我在想也許比較第一個字符串中的第一個單詞和第二個字符串中的所有單詞,但恐怕這會讓這個過程變得很慢。
Levenshtein爲什麼不夠?你的目標是什麼?你如何定義相似性? – Baz 2012-07-23 16:30:44