我想解析這個HTML。Scrapy不處理Xpath和CSS選擇器中的TBODY
<table id="ctl00_LeftColumnMiddle_Table1" border="0">
<tbody>
<tr>
<td>
<table border="0">
<tbody>
<tr>
<td >Contractor Name</td><td>UNITED RENTALS HIGHWAY TECHNOLOGIES INC</td>
</tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td><table border="0">
<tbody>
<tr>
<td >Contractor Name</td><td>UNITED RENTALS NORTHWEST INC</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
它有幾個#ctl00_LeftColumnMiddle_Table1
TRS和具有table
每個tr
我要處理的每個記錄(事實上是一個TR),然後每個記錄的過程細節裏面。
我試過這些選擇器/ Xpaths。
Selector(response).xpath('//*[@id="ctl00_LeftColumnMiddle_Table1"]/tbody/tr')
和
Selector(response).css('#ctl00_LeftColumnMiddle_Table1 > tbody >tr')
但這不返回任何結果。
但如果我這樣做
Selector(response).css('#ctl00_LeftColumnMiddle_Table1 tr')
但這種表達也與Contractor Name
太多選擇內tr
秒。
這是Scrapy中的錯誤嗎?
如果是這樣,有沒有其他方式來處理記錄我想要的方式?
'tbody'是自動生成一個標籤,所以你最好避免選擇 – Andersson