2
我有我使用Scrapy正在解析以下HTML之間的文本:Scrapy:獲取兩個標識符
<TD CLASS="dddefault">
<SPAN class="fieldlabeltext">Associated Term: </SPAN>Fall 2015 - Qatar
<BR>
<SPAN class="fieldlabeltext">Registration Dates: </SPAN>Apr 09, 2015 to Aug 27, 2015
<BR>
<SPAN class="fieldlabeltext">Levels: </SPAN>Graduate, Undergraduate
<BR>
</TD>
我想要得到的東西一樣這是第一個SPAN和BR和之後的日期之間的期限第二個SPAN和BR之間。
我嘗試這樣做:
term = response.xpath('//td[@class="dddefault"]/span[@class="fieldlabeltext"][1]/following-sibling::text()').extract()
date = response.xpath('//td[@class="dddefault"]/span[@class="fieldlabeltext"][2]/following-sibling::text()').extract()
但是,這些給我下面的一切文字也是如此。
是否有任何方法可以在SPAN之後和BR之前獲取文本?
謝謝。