我使用引入nokogiri得到來自中國的網站(Taobao.com)圖片:引入nokogiri:不能屏幕刮頁面(taobao.com)
url = "http://item.taobao.com/item.htm?spm=a1z10.1.w137644-1960500098.43.d7Uwpx&id=36246359192"
doc = Nokogiri::HTML(open(url))
puts doc.css("title").text
puts doc.css("img")[0]['src']
puts doc.css("img#J_ImgBooth")[0]['src']
我能拿到冠軍和doc.css("img")[0]['src']
,但我無法獲得img#J_ImgBooth
。問題是什麼?莫名其妙?
'' – cqcn1991
這就是我看到的。有一個'src'屬性 – cqcn1991
你是否從chrome的元素檢查器中看到了這個?它可能會在頁面加載時由js修改,它可能不是Nokogiri正在看到的實際html代碼。 – nickcen