1
我讀一個荷蘭的網頁:HttpWebRequest的迴歸打破字符
HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(website);
oReq.Method = "GET";
HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse();
HtmlDocument doc;
doc.Load(resp.GetResponseStream(), Encoding.GetEncoding("iso-8859-1"));
當我在頁面內的一些隨機元素的文本,我得到一些奇怪的字符,而不是荷蘭人那些我在Chrome中看到:
HtmlNode node = doc.DocumentNode.SelectSingleNode(xpath);
if(node != null)
{
MessageBox.Show(node.InnerText, "--- just scrapped some xpath ---");
}
而不是咖啡廳我得到中央美術學院©
如何解決這個問題?當我將它寫入一個文件時,我將它分配給一個richtextbox等等,同樣的破碎文本。
嘗試將編碼更改爲Unicode,例如utf-8 – dotnetom
謝謝!我正在處理的大代碼,我在另一個未被處理的代碼路徑中試過,並且認爲我真的排除了這種可能性。再次感謝!把這個作爲答案我會接受它。 – kawa