2014-05-01 68 views
0

我得到網頁源代碼如何在獲取頁面源代碼時解決編碼問題?

  Uri url = new Uri(urlAddress); 
     WebClient client = new WebClient(); 
     client.Encoding = System.Text.Encoding.UTF8; 
     string htlm = client.DownloadString(url); 

,但它在kickass.to給人品問題(torrrent網站),即使它在源代碼中寫道

 "meta http-equiv="Content-Type" content="text/html; charset=utf-8""        

也試過這個方法http://www.tech-recipes.com/rx/1954/get_web_page_contents_in_code_with_csharp/得到哪些沒有工作

源代碼示例源代碼:http://pastebin.com/ycBjWLRi

我怎樣才能獲得源代碼是否正確?

+0

「性格問題」你有什麼問題? –

+0

@VladimirGondarev我得到「 \ b \ 0 \ 0 \ 0 \ 0 \ 0 \0 」ys F r + {i 8\b % x w} $? .....「,當我嘗試獲取頁面源代碼時。這是什麼用JavaScript? – korrupt

回答

0

我發現了一些有關強制字符編碼在最近的文章中,我在讀了:

它說,你應該設置它是這樣的:

HtmlWeb htmlWeb = new HtmlWeb() { 
    AutoDetectEncoding = false, 
    OverrideEncoding = Encoding.GetEncoding("iso-8859-2") 
}; 

這是使用Html敏捷包,你已經標記了你的問題,但你似乎並沒有實際使用它在你的代碼示例上面或我n您在tech-recipes.com上鍊接到的文章。

+0

我不能讓這個工作http://i.imgur.com/luIX0Nw.png它給「無效的URI:URI方案無效」,但我發現這個http://i.imgur.com/NhKnZYU.png其中按我的意願工作。我怎樣才能實現你的? – korrupt