2010-03-22 47 views
1

如何從網上直接提取標題,網頁標題?從網頁中提取標題

+0

請提供更多細節。 – JoshBerke 2010-03-22 15:34:28

+0

作者:Header你是指''標籤的內容嗎?或實際的HTTP標頭內容? – 2010-03-22 16:03:23

+0

內容 – NikRED 2010-03-23 06:36:42

回答

0

您可以使用正則表達式和WebRequest/WebResponse類的組合來完成此操作。對於任何網頁抓取需求,我強烈建議您研究一下使用Simon Mourier的Html Agility Pack,它更加容忍'bad'HTML,並且允許您將DOM作爲正確的XML樹進行遍歷。

0

第1步 - 使用WebRequest從您想要從中提取信息的網頁獲取WebResponse。

第2步 - 你將最終獲得什麼本質上是一個字符串,它代表了HTML或XHTML網頁,所以你需要的,如果你有任何問題,無論這些剝離出你想要

位步驟,確保你的問題包含大量關於問題的細節。

0

我會使用正則表達式來解析頁面HTML爲<title>.*?</title>

雖然我不確定你會如何得到「標題」。您需要某種規則來確定標題的樣子。

如果它只是head標籤,您可以使用前面提到的標題方法來獲得該標籤。