-3
A
回答
0
import scrapy
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.selector import Selector
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from urlparse import urljoin
class CompItem(scrapy.Item):
name = scrapy.Field()
price = scrapy.Field()
location = scrapy.Field()
class criticspider(CrawlSpider):
name = "craig"
allowed_domains = ["newyork.craigslist.org"]
start_urls = ["http://newyork.craigslist.org/search/cta"]
def parse(self, response):
sites = response.xpath('//div[@class="content"]')
items = []
for site in sites:
item = CompItem()
item['name'] = site.xpath('.//p[@class="row"]/span[@class="txt"]/span[@class="pl"]/a/text()').extract().
item['price'] = site.xpath('.//p[@class="row"]/span[@class="txt"]/span[@class="l2"]/span[@class="price"]/text()').extract()
item['location'] = site.xpath('.//p[@class="row"]/span[@class="txt"]/span[@class="l2"]/span[@class="pnr"]/small/text()').extract()
items.append(item)
return items
+0
感謝John的幫助。有效! – James
相關問題
- 1. 如何抓取網站?
- 2. nginx可抓取的網站facebook分享
- 3. 如何抓取SimpleHTMLDom返回的網站?
- 4. 如何抓取我自己的網站?
- 5. scrapy抓取網站
- 6. 如何解析/抓取/抓取特定信息的網站?
- 7. 安裝抓取,網站抓取庫
- 8. 網站抓取器每隔幾秒就抓取一次網站
- 9. 我如何從Python網站抓取網站上的pdf鏈接
- 10. 我如何從R網站抓取這個網站的信息?
- 11. 如何抓取一個網站
- 12. 如何抓取網站證書?
- 13. 如何從網站上抓取數據
- 14. 如何從網站上抓取信息?
- 15. 如何抓取Hype Machine等網站?
- 16. 搜索引擎如何抓取網站?
- 17. 如何使用scrapy抓取網站?
- 18. 網站抓取問題網站
- 19. 如何抓取網站並截取每個網頁的截圖?
- 20. 軟件抓取/抓取網站的網址
- 21. apache nutch不抓取網站
- 22. 抓取網站使用PHP
- 23. 網站抓取和截圖
- 24. 抓取整個網站python
- 25. 網站內容抓取
- 26. 從網站抓取數據
- 27. 從網站抓取文本
- 28. 從網站抓取數據
- 29. Scrapy - 抓取和刮網站
- 30. 從網站抓取圖片
到目前爲止你做了什麼? – Jithin
嗨,詹姆斯。我們試圖鼓勵新用戶(以及所有人)展示他們的研究成果。我期望如果你在這裏搜索,GitHub和網頁通常你會發現CraigsList的某種形式。但是,請記住CraigsList公司可能對刮板的視角不清楚,因爲運行一個是試圖免費獲取數據,以致其他人花費了大量時間和金錢進行組裝。至少你需要在兩次擦傷之間留下暫停,並且如果這是CraigLists的決定,那麼接受IP封鎖。 – halfer