2011-11-07 70 views
0

畢竟,感謝您的時間。嘗試使用XPath pik信息

我想從某些網站中選取信息,並且遇到任何類似的表達式問題。

  <a class="xxxxx"> 
      <br> 
      Hi 
      <br> 
      <span class="hpn">City</span> 
      : Barcelona 
      <br> 
      <span class="hpn">color</span> 
      : Blue 
      <br> 
      <span class="hpn">Price</span> 
      : 50 
      <br> 

我想挑城市色彩,價格等信息的結果巴塞羅那,藍,50

我正在等候你的答案!

+1

我們正在等待您向我們展示您迄今爲止所嘗試的內容。 –

+0

使用Xpath的任何理由?爲什麼不使用正則表達式來提取信息。上面的例子實際上是HTML,而不是XML? – tazyDevel

回答

2

在沒有任何其他信息包括你對Xpath的知識的情況下,我會指導你到Xpath tutorial

0

由於上面的文本是HTML而不是XML(儘管您將它標記爲XML),所以我認爲您不能按原樣運行它。以上提取不能被解釋爲格式良好的XML,除非您爲<a>標記添加結束標記(假設您忘記複製該標記),而且所有<br>標記都需要自行關閉<br/>才能獲得此結果解析。由於我不知道用什麼語言來嘗試這個(未指定),也許你的解析器可以正常工作,但我仍然擔心XPath查詢的結果。不過,假設它會工作,查詢像

//a[@class='xxxxx']/span[text()='City']/following-sibling::text()[1] 

將返回「:巴塞羅那」(你可以串其刪除「:」部分)

//a[@class='xxxxx']/span/following-sibling::text()[1] 

將返回在每個跨班級之後的第一個兄弟姐妹