2011-04-08 39 views
0

我想下載當我們在瀏覽器中右鍵點擊查看頁面源時獲得的相同信息。我想要做到這一點無論是在vb.net或perl如何在vb.net或perl下載網頁的頁面源信息

我需要它爲谷歌圖片搜索結果網頁。 當頁面被保存時,html代碼與視圖頁源信息不一樣。 圖像標籤不存在。

在vb.net我想

 Dim objHttp As Object, strURL As String, strText As String 

    objHttp = CreateObject("MSXML2.ServerXMLHTTP") 

    strURL = "http://www.google.co.uk/images?as_q=aboriginal&hl=en&output=search&tbs=isch:1,iur:fmc&btnG=Google+Search&as_epq=&as_oq=&as_eq=&as_sitesearch=&safe=images&as_st=y&biw=1600&bih=799" 

    objHttp.Open("GET", strURL, False) 
    objHttp.setRequestHeader("User-Agent", _ 
     "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)", "Accept", "image/png,image/*;q=0.8,*/*;q=0.5") 

    objHttp.Send("") 

    strText = objHttp.responseText 

    objHttp = Nothing 

    RichTextBox1.Text = strText 

雖然上述方法使我在谷歌指的是短短的一句話每個圖像下面的鏈接,搜索結果圖像不返回圖像標籤(由圖像標籤圖像搜索)。

有沒有什麼辦法讓在vb.net整個查看頁面源信息或Perl

回答

0

我會嘗試:在瀏覽器中

關閉JavaScript。現在去訪問Google圖片搜索頁面(鏈接到您的源代碼中) - 網址會稍微改變。

我猜測,加載這個稍微改變了URL的VB會給你正常的HTML,而不是一堆混淆的JavaScript。