我目前正致力於從HTML
提取數據。我想提取兩個<p class="xfHeading">
標籤之間的文字。兩個標籤之間的XQuery提取
<p class="xfHeading"><b>XYZ:</b></p>
<p>asdfghjk</p>
<p>sdsdsd</p>
<p>asdvcvcfghjk</p>
<p class="xfHeading"><b>ABC:</b></p>
<P>fvgbhnjm</P>
<p class="xfHeading"><b>PQR:</b></p>
<ul>
</ul>
<p class="xfHeading"><b>MNO:</b></p>
<ul>
<li>jdjshdj</li>
</ul>
的輸出應該是:
asdfghjk
sdsdsd
asdvcvcfghjk
做到這一點一種方法是:
/p[class="xfHeading"]/following-sibling::p[0]|/p[class="xfHeading"]/following-sibling::p[1]|/p[class="xfHeading"]/following-sibling::p[2]
或
/p[class="xfHeading"]/following-sibling::p[position()<4]
然而,由於不斷改變我需要,其中,所述兩個標籤<p class="xfHeading">
之間的內容被提取溶液中的所有的時間之間的內容。
感謝您的澄清!我用一個新建議更新了我的答案。 – nearlymonolith 2010-06-25 15:22:53