2014-11-24 64 views
0

我試圖用HtmlAgilityPack抓取一個網站,但它唯一的工作時間是當我複製HTML代碼並將其粘貼到本地文件中。然後刮掉那個文件。這是爲什麼?我如何解決這個問題?生成HTML文件並將其擦除

我得到的錯誤:「印度尼西亞字符串有錯誤的格式」,種類.. 它與文件編碼有什麼關係?

請注意,當StreamWrite將代碼轉換爲HTML文檔時,它不起作用。

謝謝。

+1

請發佈您的代碼:) – mihai 2014-11-24 12:01:11

+0

使用WebClient.DownloadString(url)將其下載爲字符串,然後使用HtmlDocument通過節點進行下載。 未編輯粘貼:http://codepaste.net/jv2p9w – user3581054 2014-11-24 12:06:55

+0

你可以'Console.Writeline'下載'string'嗎?它看起來不錯嗎?它是空的,空的,等等? – mihai 2014-11-24 12:26:26

回答

0

原來,System.Net.WebClient沒有按照我的想法工作。我使用HtmlAgilityPack.HtmlWeb,它的工作原理!