我如何轉換我的輸入值我怎麼能一個HTML文本轉換爲UTF-8與C#
伊達€™的時間活動本週末。瀏覽並查看您身邊發生的事件。玩得開心! LoudNProudLive系列:'Hors Makers'特別版LoudNProudLive系列呈現了一款名爲Tolu(項目名人堂),Simi和Oyinkanade的「Makers」特別版。日期:週四,2015年4月30日時間:晚上8時地點:ELIAS(大洋灣購物中心),[…]
在UTF-8人類可讀的句子。我嘗試了下面的代碼,這就是我得到的。 -
這是本週末活動的時間。瀏覽並查看您身邊發生的事件。玩得開心! LoudNProudLive系列: HartMakers 特別版LoudNProudLive系列推出了一款名爲Tolu(項目名人堂),Simi和Oyinkanade的「HIT Makers」特別版。日期:週四,2015年4月30日時間:晚上8時地點:ELIAS(大洋灣購物中心),[...]
//convert html to utf-8
private static string cleanUpCodes(string value)
{
//convert from iso to utf-8
Encoding iso = Encoding.GetEncoding("windows-1252");
Encoding utf8 = Encoding.UTF8;
byte[] isoBytes = iso.GetBytes(value);
byte[] utf8Bytes = Encoding.Convert(utf8, iso, isoBytes);
string msg = utf8.GetString(utf8Bytes);
//convert to real html
msg = HttpUtility.HtmlDecode(msg);
return msg;
}
如果源編碼確實是windows-1252,那應該是對的。是什麼讓你認爲源文檔是用windows-1252編碼的?我可以猜測它的外觀是UTF-16LE,但最好的就是找出它是什麼。 – Martijn