我正在使用Scrapy處理項目。Python Scrapy:與瀏覽器中源代碼不同的響應對象
所有想要的領域,但一個得到完美的刮。缺少字段的內容根本不會顯示在Scrapy響應中(如scrapy shell中所檢查的那樣),而當我使用瀏覽器訪問頁面時,它顯示出來。在scrapy迴應中,預期的標籤在那裏,但不在標籤之間。
沒有涉及JavaScript,但是它是由服務器提供的變量(它是當前訪問該特定頁面的次數)。不涉及iframe。
已經設置用戶代理(在設置文件中)以匹配我的瀏覽器。 已經下載延遲(在設置文件)設置爲5
EDIT(加):
頁:http://www.fincaraiz.com.co/apartamento-en-venta/bogota/salitre-det-1337688.aspx
XPath來想要的元素:// * [@ id =「numAdvertVisits」]
什麼可能是這個謎的原因?
如果你能在瀏覽器中看到它,但它不是在scrapy的反應,也許那次訪問計數器是在iframe? – 2014-10-27 19:57:29
沒有iframe涉及(已更新問題)。 – 2014-10-27 20:15:16
你能提供你正在嘗試刮取的網頁的網址嗎? – Vanddel 2014-10-28 08:29:39