評論是在選擇器與多個類「row _3wYu6I _3BRC7L」。 但在抓取時,響應沒有上面的選擇器,而是具有「row _3wYu6I _1KVtzT」選擇器,並且此選擇器具有空列表。實際上flipkart頁面Flipkart page中具有值「_3BRC7L」的所有類都被轉換爲值爲「 _1KVtzT「作爲迴應,我得到了通過刮擦。 The list of elements that I get when using xpath of the parent class。我應該如何解決這個問題?如何從flipkart評論頁面獲取正確的選擇器進行網頁抓取?
1
A
回答
1
flipkart頁面通過ajax請求生成動態內容。這就是我無法得到正確的類選擇器的原因。現在,我按照以下答案的說明更改我的代碼:To retrieve data through ajax requests。 對我來說,這是非常有幫助和簡單的,因爲我是新手,並且我不需要使用scrapy或casperjs。
0
使用xpath,你可以得到一個包含段落的特定類的div,該段落包含一個id
,該段落包含值的評論。
這個選擇器是一個很好的開始,你可以從這裏構建任何選擇器來進行評論。
//div[.//p[contains(@id, 'review')]][@class='col']
+0
我試過給xpath。但問題是flipkart現在生成動態內容,並且在抓取時,我沒有在他們的html頁面中使用正確的選擇器。所以,我使用他們頁面的Ajax請求來檢索數據。 –
相關問題
- 1. 從黃頁獲取評論
- 2. 使用BeautifulSoup進行網頁抓取:正在獲取fundsupermart數據
- 3. 獲取Facebook頁面評論的列表?
- 4. 從iframe頁面抓取網頁
- 5. 自動獲取Facebook頁面評論
- 6. 先進的網頁抓取
- 7. 如何從抓取的網頁地址中獲取移動頁面地址?
- 8. 抓取時正確處理ASP.NET頁面
- 9. 使用ruby進行網頁抓取
- 10. 使用Python進行網頁抓取
- 11. 使用Java進行網頁抓取
- 12. 使用Java Swing進行網頁抓取
- 13. 使用Python進行網頁抓取
- 14. 如何抓取網頁?
- 15. 使用ColdFusion進行頁面抓取
- 16. 用於網頁抓取的Customazible管理頁面(網頁界面)
- 17. 網頁抓取和鏈接評估
- 18. 從網頁抓取文本
- 19. 取下asp.net頁面的JavaScript評論
- 20. 如何從網頁上抓取數據?
- 21. 如何從谷歌網站頁面獲得評論?
- 22. 如何知道Facebook評論審覈的評論頁面網址?
- 23. 如何正確抓取無限滾動的網頁?
- 24. 從抓取的網頁中提取值
- 25. Web抓取:如何從某個頁面獲取特定元素?
- 26. 如何從頁面抓取時獲取數據
- 27. Google抓取方式 - Googlebot(桌面)無法正確呈現網頁
- 28. 如何評論jspx頁面
- 29. 網頁抓取/抓取的資源
- 30. 從粉絲頁面獲取facebook評論發佈/更新
你會顯示你的代碼嗎?您是否檢查過這些類是否爲每個頁面加載時隨機生成的值?_3BRC7L','_1KVtzT'? –
是的,你是對的,它們是隨機生成的值。我現在糾正了我的代碼。謝謝 –