2012-02-12 35 views
0

我試圖scrapp頁面源代碼,但我發現在響應整個頁面源代碼不到來意味着一些div值雖然它出現在頁面查看源中但未進入c#響應。在c#窗口應用程序中刪除整頁源代碼

請指導我如何在c#windows應用程序中獲取那些丟失的潛水值。

+1

頁面的那些部分是由JavaScript生成的嗎? – svick 2012-02-12 15:14:35

回答

0

您在響應中缺少的元素可能是使用JavaScript即時添加的元素。

假設您使用HttpWebRequest加載頁面,那麼在執行此類請求時,JavaScript將無法在您所刮取的URL上執行。

使用WinForms,你可以使用一個WebBrowser控件,它可以讓你加載一個網頁,然後在加載完成時,你可以得到頁面的源代碼。我相信會執行頁面上的JavaScript。

+0

我想跟蹤谷歌ig搜索結果中的「複製快捷方式」鏈接, 它出現在頁面查看源中,但不是在C#響應中。 請指導我如何跟蹤「複製快捷方式」鏈接的鏈接 – 2012-02-16 09:21:49

0

您可以使用下面的語法,其中panel-header是HTML的ClassName,用於標識我們的html部分。

var panelHeader = driver.FindElement(OpenQA.Selenium.By.ClassName("panel-header")).Text; 

如果你沒有類名或要使用標識,那麼你必須選擇

By.Id(「破折號= 1234」) 這將獲取從給定的類中的所有文本或ID。

相關問題