枚舉值我有六種不同的值的枚舉:選擇通過串相似
一個 兩個 三 四 五 六
這是從一個配置文件填充(即字符串)
假設有人在配置文件中寫入任何值
- 在
- 一個
- onbe
或其他常見的拼寫錯誤/錯別字,我想設置從枚舉最相似的值(在這種情況下,「一」),而不是扔了。
C#是否具有類似於內建的東西,還是必須修改C#的現有編輯距離算法並將其掛接到枚舉中?
枚舉值我有六種不同的值的枚舉:選擇通過串相似
一個 兩個 三 四 五 六
這是從一個配置文件填充(即字符串)
假設有人在配置文件中寫入任何值
或其他常見的拼寫錯誤/錯別字,我想設置從枚舉最相似的值(在這種情況下,「一」),而不是扔了。
C#是否具有類似於內建的東西,還是必須修改C#的現有編輯距離算法並將其掛接到枚舉中?
您可以使用Levinshtein distance,這告訴我們把一個字符串到另一個需要編輯的數量:
所以只是經過的所有值的枚舉和計算Levinshtein距離:
private static int CalcLevenshteinDistance(string a, string b)
{
if (String.IsNullOrEmpty(a) || String.IsNullOrEmpty(b)) return 0;
int lengthA = a.Length;
int lengthB = b.Length;
var distances = new int[lengthA + 1, lengthB + 1];
for (int i = 0; i <= lengthA; distances[i, 0] = i++) ;
for (int j = 0; j <= lengthB; distances[0, j] = j++) ;
for (int i = 1; i <= lengthA; i++)
for (int j = 1; j <= lengthB; j++)
{
int cost = b[j - 1] == a[i - 1] ? 0 : 1;
distances[i, j] = Math.Min
(
Math.Min(distances[i - 1, j] + 1, distances[i, j - 1] + 1),
distances[i - 1, j - 1] + cost
);
}
return distances[lengthA, lengthB];
}
因此,如果我理解了正確的評論和回答,枚舉就沒有像內建的東西。這就是我想知道的。 – Alexander
我還沒有面對過它。我絕對同意@DGibbs,最好拋出一個錯誤。例如,如果您將「Onc」作爲輸入字符串(On或One),您希望選擇哪個枚舉值?但是如果你想非常實現你的功能,你可以使用Levinshtein距離) –
[此](http://stackoverflow.com/a/1034655/2030635)測量字符串之間的相似性的答案可能有所幫助。 –
因此,如果我理解正確的評論和答案,枚舉沒有像內建的東西。這就是我想知道的。 – Alexander
個人而言,我認爲如果在這種情況下拋出錯誤會更好。從用戶角度來看,如果我的拼寫錯誤得到驗證,我會很困惑。有'Enum.Parse()'這將成功的小寫'「一個」,例如'Enum.Parse(typeof(myenum),「one」,true)'你可以告訴它忽略大小寫。最好的辦法是實現下面列出的levinshtein距離算法,並嘗試在解析之前將輸入與您的枚舉值進行匹配。同樣,我會建議不要這樣做。 – DGibbs