我是新來的Xpath,試圖scrapy網站下面的格式:Scrapy,蟒蛇,Xpath的如何匹配相應項目在HTML
<div class="top">
<a> tittle_name </a>
<div class="middle"> listed_date </div>
<div class="middle"> listed_value </div>
</div>
<div class="top">
<a> tittle_name </a>
<div class="middle"> listed_date </div>
</div>
<div class="top">
<a> tittle_name </a>
<div class="middle"> listed_value </div>
</div>
listed_value & listed_date的派駐都是可選的。
我需要將每個tittle_name與各自的listed_date,listed_value(如果可用)進行分組,然後向MySQL插入到達記錄。
我使用scrapy shell這給像
listings = hxs.select('//div[@class=\'top\']')
for listing in listings:
tittle_name = listing.select('/a//text()').extract()
date_values = listing.select('//div[@class=\'middle\']')
上面代碼中一些基本的例子給我tittle_name和可用listed_date的名單,listed_value,的名單,但如何搭配他們? (由於格式不對稱,我們無法按索引進行搜索)。
謝謝。
是的,您是對的。能夠決定listed_date&listed_value。但是每個tittle_name可能具有listed_date或listed_value,可能同時具有兩個或者可能沒有。格式不是對稱的。因此,從上面的Python代碼列表中,我不知道如何在嘗試插入MySQL時將tittle_name與各自的listed_date,listed_value進行匹配。也許需要不同的方法? – learnJQueryUI 2011-03-18 06:26:23