0
我有一個內置C#的網絡爬蟲(我知道),它在處理許多通常由一個實際的Web瀏覽器處理的功能方面已經相當複雜。也就是說,我沒有任何東西可以解析傳入的HTML並處理頁面上的嵌入式JavaScript命令。尋找一個嵌入式JavaScript解析器
我已經嘗試了許多方法 - 從Noesis到Awesomium - 但似乎沒有工作。我也犯了使用WinForms嵌入式Web瀏覽器控件的錯誤,並且加載時的內存泄漏(我正在運行「並行任務」)從字面上損壞了CLR。也就是說,它能夠將頁面作爲普通瀏覽器進行處理,並且生成的內容非常棒 - 不可行,但最終的結果內容卻很重要。
那裏有沒有什麼東西可以接受目標URL,或者理想情況下是接受通過HttpWebRequest下載的HTML內容並處理嵌入式JavaScript命令?
http://htmlagilitypack.codeplex.com/ – themis 2011-12-23 17:30:30