我想從xpath中抽取很多頁面的鏈接,我不確定我在這裏做錯了什麼。頁面的格式很差,用斜體表示,我認爲這是拋棄它。如何從xpath中的斜體元素之後的鏈接中提取網址?
這是對HTML的格式呈現方式的一例:
<p>
<i>This content is constant</i>
<a href="example.com/exampe123">
<i>This text changes</i>
</a>
<i> </i>
</p>
在這個例子中,單詞「text」並沒有改變,但是的話,其餘做。
我嘗試使用以下XPath,但它沒有工作:
//p/a[contains(text(), 'text')]/@href