2013-08-01 30 views
0

首先我想知道如何實現這一般,然後也許有人知道如何使用水豚完成這一點。提取(隨機)圖像沒有有用的src =從網頁

例如:<img src="http://example.com/getrandomimage"> 事情是,src指向一個腳本,該腳本返回隨機圖像,而不是圖像本身。 頁面已加載,腳本運行,圖像顯示。我可以很容易地得到src值,但是如果我訪問鏈接以下載圖像,腳本將再次運行並返回完全不同的圖片。而且我需要頁面上已有的。

+0

你需要顯示你寫的代碼,試圖解決這個問題。請參閱http://meta.stackexchange.com/questions/156810/stack-overflow-question-checklist –

+0

什麼是輸入HTML的示例?你期望得到什麼結果? –

+0

請看編輯,希望現在清楚 –

回答

0

我認爲使用JS或Capybara的過程會非常相似。我把它分成兩步:

  1. 寫一個選擇器,可以找到<img>標記。在JS這可能看起來像:返回的節點上

    myImg = document.getElementByTagName("img") 
    
  2. 呼叫.src

    result = myImg.src 
    

我相信水豚被限制爲XPath和CSS選擇器。因此,根據您試圖抓取的頁面,您必須在HTML標記或CSS屬性中標識某種模式才能找到<img>標記。

+0

寫入選擇器不成問題。但是不會.src只是返回'src'的值,就像我的例子一樣? –

+0

我一定不明白這個問題。 –