2012-01-09 78 views
0

如您所知,拉丁字母表中u/v和i/j之間沒有區別。將這些信件分開是一個非常晚的傳統,許多拉丁文文本沒有這樣的分離。 遵循這個傳統,我決定讓我的小字典的用戶找到不考慮u/v和i/j字母的單詞。例如,通過輸入'adjuvo','adiuvo','adjuuo'等,用戶將得到相同的結果。達到此目的的最佳方式是什麼?例如,我有一個單詞列表。我怎樣才能讓所有的單詞讓Python不會有不同的u/v和i/j?非常感謝!可互換字母

回答

6

Canonicalise字符串前匹配。用你的所有v取代所有v,用我的所有j取代所有v。在字典中,存儲從每個規範形式到所有匹配的非規範形式的映射。

+0

謝謝,我會試試。 :-) – ghostmansd 2012-01-09 23:58:37