我想從其中有表的html頁面獲取一些數據。我得到了行烏金的XPath的名單,現在我想獲得的td
內tr
每個元素內的文本(),這裏是tr
python xpath空間沒有被刪除
<tr>
<td>
<a href="#" onclick="WhoisOrderDomain('bank'); return false;"> SHOP
</a>
</td>
<td>COUNTRY</td>
<td class="text-right">1 038,00 USD</td>
<td class="text-right">899,00 USD</td>
<td class="text-right">899,00 USD</td>
<td class="text-center">
<a class="btn btn-sm btn-info" href="#" onclick="WhoisOrderDomain('bank'); return false;"><i class="fa fa-shopping-cart"></i> Order</a>
</td>
</tr>
下面
的基本結構是我在Python的XPath:
td_xpath = XPath("./td/a/text()[normalize-space()] | ./td/text()[normalize-space()]")
和我得到這個輸出:
['\r\n SHOP\r\n ', 'COUNTRY', '1038,00 USD', '899,00 USD', '899,00 USD', ' Order']
空間爲什麼不從第一個元素刪除嗎?
如何使用xpath從價格中刪除','和'USD'?
在爲什麼我的代碼不工作我上面的例子嗎? – anekix
@anekix [normalize-space()]是一個過濾器,可以清除空字符串。它不會改變字符串。 –
Thankyou爲你的迴應,但我有difficuly理解爲什麼我的代碼不工作? './td/a/text()[normalize-space()]'this seleects/td/a/text()然後將過濾器應用於它?因爲具有相同語法的下一個xpath正在工作 – anekix