我有這樣與TAG xml文件:C#XmlTextReader的:HTML實體更換
<Question>dzia&#322;owa</Question>
我閱讀使用XmlTextReader的這個文件,這個標籤我得到這樣的:
działowa
如何替換我的xml中的html實體編號以獲得如下所示的內容:「działowa」?
我有這樣與TAG xml文件:C#XmlTextReader的:HTML實體更換
<Question>dzia&#322;owa</Question>
我閱讀使用XmlTextReader的這個文件,這個標籤我得到這樣的:
działowa
如何替換我的xml中的html實體編號以獲得如下所示的內容:「działowa」?
您示例中唯一的HTML實體是&
。然後你得到了一些正常的文字,說#322;
。要麼你想
<Question>dzia&łowa</Question>
這將使 「dzia & LOWA」(可能不是你想要的)
或
<Question>działowa</Question>
這將使 「działowa」
我想我解決了部分問題(編碼&#數字到字符):
public static string EntityNumbersToEntityValues(string s)
{
Match match = Regex.Match(s, @"&#(\d+);", RegexOptions.IgnoreCase);
while(match.Success)
{
string v = match.Groups[1].Value;
string c = char.ConvertFromUtf32(int.Parse(v));
s = Regex.Replace(s, string.Format("&#{0};", v), c);
match = match.NextMatch();
}
return s;
}
爲什麼你的標籤的內容被轉義了兩次?如果可能的話,解決問題。 – dtb 2010-10-19 11:28:41
可能我必須通過名稱使實體名稱變成 - 之後 - 我將會有文本,如「dzia ł owa」,現在 - 如何將實體編號「&#322」更改爲有效文本「ł」? – UGEEN 2010-10-19 11:36:46