2016-01-11 60 views
0

我從谷歌購物試圖提取物產品的價格 s的谷歌電子表格中提取數據:如何從HTML使用XPath

=IMPORTXML("https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0";"/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b") 

XPath查詢是:

/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b 

但我沒有結果。

什麼錯了?從谷歌購物

HTML Google Shopping

+1

你只能導入這個頁面的_source_ HTML,它幾乎只有Javascript。你正在尋找的元素'span [@class ='price']'由這個JS生成,但不存在於源代碼中。據我所知,除了自定義加載項外,Google表格本身無法獲取此內容。 –

+0

感謝您的回覆 – user2925795

回答

1

,因爲谷歌在實際未返回HTML。看到頁面的源代碼

  • view-source:https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0
+1

感謝您的回覆。 Google爲您的網域使用不同的腳本,在Google.FR和GOOGLE.com上使用我的代碼。 – user2925795

1

嘗試使用用戶代理同時獲得從谷歌的HTML。這是我前幾天遇到的問題,並通過模仿用戶代理成爲Chrome瀏覽器來解決問題。 您可以在Google上找到模仿User-Agent的不同方法(無雙關語)。