1
是否有一些很好的教程或示例瞭解http網頁抓取?如何開始開發一個工具,可以搜索一些網站和下載特定的信息,所以我可以自動收集它,然後分析?謝謝!如何開始學習開發一個http抓取工具
是否有一些很好的教程或示例瞭解http網頁抓取?如何開始開發一個工具,可以搜索一些網站和下載特定的信息,所以我可以自動收集它,然後分析?謝謝!如何開始學習開發一個http抓取工具
通常爲此推薦的工具是Html Agility Pack。它將採用格式不正確的HTML,並將其轉換爲XHTML,然後是可穿透的DOM,因此對於您在野外找到的代碼非常有用,與RegEx等註定要破解的方法相反。
有一些例子和API文檔在這裏:
http://html-agility-pack.net/api
一些有用的鏈接:
很酷上手,謝謝。 – willyMon 2012-01-27 16:36:02