Q

Scrapy with empty content</td>，我如何獲得內容？

2014-12-01 39 views 0 likes

0

當我使用scrapy將所有表元素都捕獲到csv文件時，我幾乎完成捕獲所有數據，只是某些表列是空的（例如，<td></td>），是否有任何方法可以防止發生這種情況？我使用scrapy外殼xxx.com並使用sel.xpath(xxx)來獲取數據，但沒有顯示<td></td>，但網站框架來源有。所以當我使用sel.xpath(xxx)數據到我的csv文件時，格式會出錯。Scrapy with empty content</td>，我如何獲得內容？

2014-12-01 chinlam91

+0

@MattDMo感謝您編輯我的英文破碎。 – chinlam91 2014-12-01 17:54:53

A

回答

0

1.You可以嘗試的路徑，

sel.xpath('//td/text()').extract()

2.Might是網站的所有者已被封鎖像yell.com刮。

2014-12-02 04:45:17

+0

hi @anandhakumar，我知道這部分，只是sel.xpath（'// td/text（）'）。extract（）避免中的空白內容，btw謝謝你的評論。 – chinlam91 2014-12-02 05:49:58

相關問題