2014-11-23 58 views
-1

你好,我想問的東西......有沒有一種方法來讀取網站的一些信息,像我想讀的每本書我不從背後閱讀來自網站的代碼背後的東西

代碼自己在一些網站的頁面...我可以做到這一點,怎麼做?

不只是黑客讀取明文沒有HTML代碼的方式想讀

我不知道該怎麼做還是怎麼做,我需要一個想法

而且是有方法來搜索幾個網站的特定詞和API來使用它的搜索網站

回答

2

您仍然必須閱讀HTML,因爲這是標題傳輸的方式。

使用HttpWebRequest類向Web服務器發出請求,然後使用HttpWebResponse將響應和GetResponseStream()方法返回給響應。然後你需要以某種方式解析它。請參閱HTMLAgilityPack以解析HTML。您可以使用它來從HTML中獲取標題元素並閱讀它。然後,您可以獲取頁面中的所有錨點元素,並確定下一個要訪問的站點上要掃描哪些標題。

1

有強大的HTML解析器,可對於.NET,您可以使用XPath用於讀取HTML頁面, HTML Agility pack

您可以使用內置的WebClient類來從頁面獲取數據作爲字符串,然後執行字符串操作。