0
我試圖解析http://www.wein-wg.de/wwg/rheinhessen/worms-pfeddersheim/weingut-goldschmidt/,但不能得到正確的字符集。該網站使用iso-8859-1。不知何故,所有的Unicode字符顯示爲?在Visual Studio中。錯誤的HTML編碼與敏捷包
是否有可能將其轉移到Visual Studio或其他地方的正確字符集?
我試圖解析http://www.wein-wg.de/wwg/rheinhessen/worms-pfeddersheim/weingut-goldschmidt/,但不能得到正確的字符集。該網站使用iso-8859-1。不知何故,所有的Unicode字符顯示爲?在Visual Studio中。錯誤的HTML編碼與敏捷包
是否有可能將其轉移到Visual Studio或其他地方的正確字符集?
using HtmlAgilityPack;
HtmlDocument doc;
HtmlWeb web = new HtmlWeb();
private void getPage(string url)
{
web.OverrideEncoding = Encoding.GetEncoding("iso-8859-1");
doc = web.Load(url);
webBrowser1.DocumentText = doc.DocumentNode.OuterHtml;
}
getPage("http://www.wein-wg.de/wwg/rheinhessen/worms-pfeddersheim/weingut-goldschmidt/");
解決了:
HtmlWeb Webget = new HtmlWeb();
HtmlDocument doc = new HtmlDocument();
Webget.AutoDetectEncoding = false;
Webget.OverrideEncoding = Encoding.UTF8;
doc_tmp.OptionOutputAsXml = true;
doc_tmp.OptionReadEncoding = true;
doc_tmp.OptionFixNestedTags = true;
doc_tmp.OptionDefaultStreamEncoding = Encoding.UTF8;
doc_tmp.LoadHtml(tmp.InnerHtml);
doc_tmp.Save(Console.Out);