我有一個文本文檔,它是被許可人的名單。我正在循環這個文檔來創建這個數據的html表格。我遇到過帶有非標準字符的名字。使用.net將字符轉換爲html等效品
這是其中之一
艾梅
我試圖通過下面的函數運行所有的投入,但是當它遇到上述字符它不會取代它。
Function ReplaceBadCharacters(ByVal input As String) As String
Return input.Replace(Chr(233), "é")
End Function
我該如何用html等價物替換每個字符?
EDIT
當調試上述功能它顯示了輸入作爲艾梅[]和不艾米。
在Chrome中,它看起來像這樣艾梅
然後你的編碼是錯誤的。 – SLaks 2011-04-05 14:28:42
當我在記事本++中打開文檔時,它將編碼顯示爲ANSI。當我在記事本++中將其更改爲UTF-8時,它顯示字符爲'xE9' – guanome 2011-04-05 14:34:36
聽起來像é可能是不同的字形。你的名冊中有哪些類型的文本文件? .docx,.doc,.pdf等可能會爲非標準字符插入非標準字形。如果它是.txt或任何基於ASCII的文檔,請檢查編碼。您可能會以UTF8格式讀取文件,並且文檔爲UTF ##,反之亦然。另外,請確保在讀取文件時指定編碼類型。 – 2011-04-05 14:36:14