2014-05-04 40 views
1

使用Scrapy,以下提取對於普通文本而言工作正常。它排除了我試圖檢索的所有BOLD標記:Scrapy結合文本和粗體

hxs.select('//td[@class="Info_Cell"]/text()').extract() 

以下只是提取BOLD文本,但不包括普通文本。

hxs.select('//td[@class="Info_Cell"]/b/text()').extract() 

如何提取文本,正常和帶有粗體標記。

回答

3

一般//會遞歸提取所有子節點,所以你的情況,你需要:

hxs.select('//td[@class="Info_Cell"]//text()').extract() 
+0

的作品!謝謝! – bobsr