2015-01-07 28 views
0

我在爬行一個網站並保存鏈接到「頁面」項目字段中每個頁面的頁面的URL,以便稍後重建網站樹。一個簡單的方法是訪問response.request.headers ['referer'],它是請求的引用頭。這個頭部實際上是否可靠?也就是說,它是否始終存在於Scrapy生成的請求中,還是有可能因爲請求不準確/不存在?使用Scrapy進行爬網時,我可以依賴具有引用標頭的請求嗎?

回答

相關問題