2017-03-22 214 views
-1

我試圖刮http://www.casemanagementguidebook.ie/Case-Management-Listings/Accommodation---Homelessness.aspx表,以便我可以輸入到MySQL數據庫的所有值。當試圖做一個殼我已經試過這給了我展示試圖刮Scrapy使用Scrapy

table = Selector xpath=u"descendant-or-self::table[@class and contains(concat(' ', normalize-space(@class), ' '), ' listing-table ')]" data=u'<table cellpadding="0" cellspacing="0" b' 

表值的命令

table = response.css('table.listing-table')[0] 

如何訪問這些數據呢?我已經使用命令

access = table.css("data").extract() 

嘗試和也試圖

access = table.css("tbody tr td").extract() 

兩者都返回一個空集。我缺少什麼路徑或命令來訪問表中的td?

回答

1

所以你要找的是每個表格行<tr>中的<td>元素。

爲了做到這一點,你會

  1. 需要先
  2. 迭代通過每個錶行選擇所有的錶行,並找到了他們每個人的<td>元素。

像這樣:

trs = response.css('.listing-table tr') 
for tr in trs: 
    tds = tr.css('td') 
    for td in tds: 
     print td.extract()