我正在使用FuzzyWuzzy String Matching module from SeatGeek。FuzzyWuzzy字符串匹配 - 區分大小寫
我發現當使用token_set_ratio搜索算法時,案例中的小差異會給出非常不同的結果。
例如,如果我在文件中查找「我正在吃東西」這個短語,我會得到100%的匹配。但是如果這句話是「我正在吃東西」,只是一個字母的變化,給我一個65%的比賽。
有什麼辦法讓算法不區分大小寫?
我正在使用FuzzyWuzzy String Matching module from SeatGeek。FuzzyWuzzy字符串匹配 - 區分大小寫
我發現當使用token_set_ratio搜索算法時,案例中的小差異會給出非常不同的結果。
例如,如果我在文件中查找「我正在吃東西」這個短語,我會得到100%的匹配。但是如果這句話是「我正在吃東西」,只是一個字母的變化,給我一個65%的比賽。
有什麼辦法讓算法不區分大小寫?
token_set_ratio()默認情況下區分大小寫。
from fuzzywuzzy import fuzz
fuzz.token_set_ratio("I am eating", "i am eating")
=> 100
你可以在所有東西上使用'.upper'? – 2013-05-09 13:39:09