我有以下HTML:如何提取從HTML文本(某些字符串後)
<li class="group-ib medium-gap line-120 vertical-offset-10">
<i class="fa fa-angle-right font-bold font-95 text-primary text-dark">
::before
</i>
<span>
abc:
<b class="text-primary text-dark">st1</b>
</span>
</li>
我想提取str1
這abc
後總是會發生的。我能夠通過使用XPATH
鏈接做到這一點:
xpath('.//b[@class = "text-primary text-dark"]')[0].text
但解決方案取決於它是這個特殊的類,它不止一次地出現,而不是總是在同一順序的第一次亮相。我想知道是否有一種方法來搜索HTML
的abc
並拉動後續文本?
我想知道你是如何在你的問題中獲得xpath的'str1'?你得到的是元素'i',其中'str1'在元素'span'' – SomeDude
草率複製粘貼,編輯。 –
只有當元素在列表中時使用[0]纔會有所作爲,因爲它們處於不同的層次上,這無關緊要,對於不同的級別,您需要使用選擇器來標識唯一父元素並從那裏繼續。 – lauda