2014-12-01 39 views
0

當我使用scrapy將所有表元素都捕獲到csv文件時,我幾乎完成捕獲所有數據,只是某些表列是空的(例如,<td></td>),是否有任何方法可以防止發生這種情況?我使用scrapy外殼xxx.com並使用sel.xpath(xxx)來獲取數據,但沒有顯示<td></td>,但網站框架來源有。所以當我使用sel.xpath(xxx)數據到我的csv文件時,格式會出錯。Scrapy with empty content​​</td>,我如何獲得內容?

+0

@MattDMo感謝您編輯我的英文破碎。 – chinlam91 2014-12-01 17:54:53

回答

0

1.You可以嘗試的路徑,

sel.xpath('//td/text()').extract() 

2.Might是網站的所有者已被封鎖像yell.com刮。

+0

hi @anandhakumar,我知道這部分,只是sel.xpath('// td/text()')。extract()避免​​中的空白內容,btw謝謝你的評論。 – chinlam91 2014-12-02 05:49:58

相關問題