我正在使用Crawler庫來幫助您製作一些XPath表達式來獲取HTML標記的內容。我目前正在閱讀頁面中的HTML5內容,並且想要以這種方式檢索未插入到標記中的文本。如何使用XPath在另一個子元素之後選擇子文本
<div class="country">
<strong> USA </strong>
Some text here
</div>
所以我想在這裏得到這個文本一些文本,但履帶庫允許得到的只是什麼是在一個標籤,而不是外面。
所以任何替代請。
這是履帶部分:
$crawler = new Crawler();
$crawler->xpathSingle($xml, '//div[@class="country"]/strong/@text');
如果你嘗試這個XPath會發生什麼:'// div [@ class =「country」]/strong/following-sibling :: text()'?問,因爲我不熟悉這個「Crawler」庫 - 我知道這個XPath在Python中使用lxml工作,例如。 –
謝謝老兄,它工作。但是,即使該文本屬於另一個標籤,它仍會獲取強標記之後的所有文本 – KubiRoazhon