2013-07-26 28 views
0

整個HTML如果DW1()的返回webbrowser.document我知道我可以做:如何從webbrowser.document

dw1.body.outerhtml 

得到身體的outerhtml。就是這樣,正文,標題等。

如果我想要獲取整個文檔的html,那麼怎麼辦?

+0

WebBrowser1.DocumentText不保證你從內WebBrowser1.Document得到所有HTML的好辦法。這是因爲有多種方法可以添加和更改不更新WebBrowser1.DocumentText的實時HTML數據。爲了確保您獲得實時數據中的所有代碼,請定位代碼中最外面的標籤,並抓住它之間的所有內容。這通常是HTML標籤。使用它代替 - WebBrowser1.Document.GetElementsByTagName(「HTML」)。Item(0).OuterHtml。我已經在另一個問題中回答了這個問題,所以我的回答在這裏被刪除了,但我想確保你得到了它。 –

回答

1

如果你有機會獲得WebBrowser控件,您可以使用DocumentText屬性:

Private Sub WebBrowser1_DocumentCompleted(sender As Object, e As WebBrowserDocumentCompletedEventArgs) Handles WebBrowser1.DocumentCompleted 
    MessageBox.Show(WebBrowser1.DocumentText) 
End Sub 
+0

這並沒有得到一切。如果您在創建DocumentText後進行了InnerHTML更改(例如),則只會獲得原始DocumentText。 OuterHTML抓取更改,但您只能獲取BODY標籤內的內容。 –