2017-10-09 74 views
1

我使用這個頁面的所有類: https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.2942j0j7&sourceid=chrome&ie=UTF-8Webscrapping引入nokogiri無法挑

我試圖讓這個元素:類=「_ XWK」

page = HTTParty.get('https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.11452j0j7&sourceid=chrome&ie=UTF-8') 

    parse_page = Nokogiri::HTML(page) 
    parse_page.css('_XWk') 

在這裏我可以看到整個頁面在parse_page中,但是當我嘗試.cc('classname')時,我什麼都看不到。我是否以錯誤的方式使用該方法?

+0

你肯定有與該類元素? –

回答

0

它看起來像是交換類,所以你在瀏覽器中看到的不是你從http調用得到的。在這種情況下,從_XWk到_tA

page = HTTParty.get('https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.11452j0j7&sourceid=chrome&ie=UTF-8') 
    parse_page = Nokogiri::HTML(page) 
    parse_page.css('._tA').map(&:text) 

# >>["Up to 23 city/34 highway", "From $22,610", "175 to 325 hp", "192″ L x 73″ W x 58″ H", "3,431 to 3,681 lbs"] 
0

變化parse_page.css('_XWk')parse_page.css('._XWk')

注意點(.)的區別。點引用一個類。

使用parse_page.css('_XWk'),引入nokogiri不知道羯羊_XWk是一個類,ID,數據屬性等。