我沒有一個特定的代碼問題我只是不知道如何在Scrapy框架後面處理以下問題:Scrapy:跟隨鏈接獲取額外的項目數據?
我想刮的數據結構通常是每個項目的表格行。直截了當,對吧?
最後,我想刮標題,截止日期,並詳細每一行。 標題和截止日期立即在頁面上可用...
但詳細本身不在表中 - 而是包含細節的網頁的鏈接(如果沒有按「T在這裏做的意義是一個表):
|-------------------------------------------------|
| Title | Due Date |
|-------------------------------------------------|
| Job Title (Clickable Link) | 1/1/2012 |
| Other Job (Link) | 3/2/2012 |
|--------------------------------|----------------|
恐怕我仍然不知道如何後勤周圍的回調,並要求通過該項目,甚至通過Scrapy的CrawlSpider部分看完之後文檔。
是否有一個基本的例子代碼的地方? – fortuneRice 2013-10-22 07:15:06
@fortuneRice,不知道如果示例是最新的:http://stackoverflow.com/questions/11150053 http://stackoverflow.com/questions/13910357/how-can-i-use-multiple-requests-and -pass-items-in-them-in-scrapy-python/13911764#13911764 – warvariuc 2013-10-22 07:26:07
這是文檔的相關部分:http://doc.scrapy.org/en/latest/topics/spiders.html – tback 2014-03-10 16:37:51