2016-05-11 90 views
1

枚舉值我有六種不同的值的枚舉:選擇通過串相似

一個 兩個 三 四 五 六

這是從一個配置文件填充(即字符串)

假設有人在配置文件中寫入任何值

  • 一個
  • onbe

或其他常見的拼寫錯誤/錯別字,我想設置從枚舉最相似的值(在這種情況下,「一」),而不是扔了。

C#是否具有類似於內建的東西,還是必須修改C#的現有編輯距離算法並將其掛接到枚舉中?

+0

[此](http://stackoverflow.com/a/1034655/2030635)測量字符串之間的相似性的答案可能有所幫助。 –

+0

因此,如果我理解正確的評論和答案,枚舉沒有像內建的東西。這就是我想知道的。 – Alexander

+3

個人而言,我認爲如果在這種情況下拋出錯誤會更好。從用戶角度來看,如果我的拼寫錯誤得到驗證,我會很困惑。有'Enum.Parse()'這將成功的小寫'「一個」,例如'Enum.Parse(typeof(myenum),「one」,true)'你可以告訴它忽略大小寫。最好的辦法是實現下面列出的levinshtein距離算法,並嘗試在解析之前將輸入與您的枚舉值進行匹配。同樣,我會建議不要這樣做。 – DGibbs

回答

1

您可以使用Levinshtein distance,這告訴我們把一個字符串到另一個需要編輯的數量:

所以只是經過的所有值的枚舉和計算Levinshtein距離:

private static int CalcLevenshteinDistance(string a, string b) 
{ 
    if (String.IsNullOrEmpty(a) || String.IsNullOrEmpty(b)) return 0; 

    int lengthA = a.Length; 
    int lengthB = b.Length; 
    var distances = new int[lengthA + 1, lengthB + 1]; 
    for (int i = 0; i <= lengthA; distances[i, 0] = i++) ; 
    for (int j = 0; j <= lengthB; distances[0, j] = j++) ; 

    for (int i = 1; i <= lengthA; i++) 
     for (int j = 1; j <= lengthB; j++) 
     { 
      int cost = b[j - 1] == a[i - 1] ? 0 : 1; 
      distances[i, j] = Math.Min 
       (
       Math.Min(distances[i - 1, j] + 1, distances[i, j - 1] + 1), 
       distances[i - 1, j - 1] + cost 
       ); 
     } 
    return distances[lengthA, lengthB]; 
} 
+0

因此,如果我理解了正確的評論和回答,枚舉就沒有像內建的東西。這就是我想知道的。 – Alexander

+0

我還沒有面對過它。我絕對同意@DGibbs,最好拋出一個錯誤。例如,如果您將「Onc」作爲輸入字符串(On或One),您希望選擇哪個枚舉值?但是如果你想非常實現你的功能,你可以使用Levinshtein距離) –