我正在使用scrapy從網頁中提取數據。我想提取的跨度標籤下錨標籤的文字如下圖所示:全部廢除文本<a>使用scrapy的span標記下的標記
<span>.....</span>
<span id = "size_selection_list">
<a>....</a>
<a>....</a>
.
.
.
<a>
</span>
我使用以下XPath邏輯:
t = sel.xpath('//div[starts-with(@id,"size_selection_container")]/span[2]')
for x in t.xpath('.//a'):
....
是達到這個問題的跨度元素,但<a>
標籤不會迭代。這裏有什麼錯誤?另外<a>
有一個HREF有JavaScript。這是問題的原因嗎?
你的邏輯將與您提供的樣本HTML:http://pastebin.com/hxSZ041j。因此,要麼不按原樣分享代碼,要麼示例HTML不是您正在使用的代碼。 –