我試圖編寫一個函數來檢測用戶輸入特定的短語/句子/單詞/單詞的準確程度。我的目標是建立一個應用程序來訓練用戶輸入某些短語的準確性。什麼字符串距離算法最適合測量打字精度?
我最初的直覺是使用基本的levenshtein距離算法(主要是因爲這是我唯一的頭腦知道的算法)。
但經過多一點研究,我看到Jaro-Winkler是一個稍微有趣的算法,因爲它考慮了換位。
我甚至發現,談到這些算法之間的差異的鏈接:
Difference between Jaro-Winkler and Levenshtein distance?
看了這一切,除了各自的維基百科文章中,我還是有點無能,其算法最符合我的目標。
聽起來像是一個開源項目的好主意。你開始回購,我會貢獻。 – adrianmc
我喜歡錯誤彙總報告的想法。對於我的打字我猜猜錯誤是: 1)錯誤的字符順序從單獨的手中。 2)拼寫錯誤,由於「close word」,'ron' - >''運行' 3)後綴加'run' - >'runs' –