這可能是與其他韓國編碼的問題不同。C# - 韓國編碼
有這個網站,我要刮,它是韓國人。
在他們的網站的一個例子句話是這樣 「爲了保護您的隱私,請使用返回按鈕在搜索結果屏幕,而不是後退按鈕的頂部和底部。」
我使用HttpWebRequest和HttpWebResponse刮網站。
這是我retreive的HTML
- 部分代碼 -
using (Stream data = resp.GetResponseStream())
{
response.Append(new StreamReader(data, Encoding.GetEncoding(code), true).ReadToEnd());
}
我現在的問題是,我沒有得到正確的韓語字符。在我的「代碼」變量,我在這裏在MSDN http://msdn.microsoft.com/en-us/library/system.text.encoding.aspx基礎的代碼頁(讓我縮小它)。
這裏是韓國的代碼頁: 51949,50225,20949,20833,10003,949
,但我仍然沒有得到正確的韓語字符?什麼問題?
什麼編碼的頁面中?它是否有任何元標籤?那麼http頭文件呢? – Oded 2012-04-05 15:49:01
它只是頭部EUC-KR,但我已經使用這個名字Encoding.GetEncoding(「EUC-KR」),並仍然得到了錯誤的韓語字符。 ?逾?逾?冤蒂森ℓ?蹂????房子? ?ㅼ冤? ⑸??你怎麼看? ????ㅻ?媛湲?逾????冤?冤gyelnaek?硫???④的Nack ??⑥?房屋逾?Soep?Ъ⑺?湲?諛???? – 2012-04-05 15:53:36
是否安裝在執行該刮的計算機上的代碼頁? – Oded 2012-04-05 15:54:18