的XPath提取HTML標籤

2013-10-05 125 views 2 likes

我想提取一個給定的HTML這是這種形式的城市和國家的XPath提取HTML標籤

<table class="wikitable sortable"> 
<tr> 
<th>Name of City/Town</th> 
<th>Name of State</th> 
<th>Classification</th> 
<th>Population (2001)</th> 
<th>Population (2011)</th> 
</tr> 
<tr> 
<td><a href="/wiki/Abhayapuri" title="Abhayapuri">**Abhayapuri**</a></td> 
<td><a href="/wiki/Assam" title="Assam">**Assam**</a></td> 
<td>TC</td> 
<td style="text-align:right;">14,673</td> 
<td style="text-align:right;"></td> 
</tr>

我試着這樣做 $x('//table/tbody/tr/td/a')

但其返回我不想要的結果（即列表包含ChileNodes，children，classList，innerHTML和其他元數據）。不知道我在做什麼錯

來源

2013-10-05 Anurag Sharma

回答

這個XPath：

$x('//table/tbody/tr/td/a/text()')

將讓你的城市和國家：

["**Abhayapuri**", "**Assam**"]

此XPath會得到你的城市：

$x('//table/tbody/tr/td[1]/a/text()') 

["**Abhayapuri**"]

而這個XPath會爲你指定狀態：

$x('//table/tbody/tr/td[2]/a/text()') 

["**Assam**"]

來源

2013-10-05 04:37:05 kjhughes

相關問題

11. PHP的DOMDocument/XPath的：獲取HTML文本和環繞標籤
12. 提取標籤
13. 提取標籤
14. 提取的XPath的HTML代碼
15. XPath提取幾個相同的div標籤內的文本
16. XPath - 獲取包含HTML標籤的數據
17. XPath的HTML獲取特定標籤元素
18. 提取HTML單元格數據的XPath
19. 用DOM/Xpath重寫HTML標籤（PHP）
20. 提取的XPath
21. XPATH在標籤
22. 使用Xpath提取html標記的完整內容
23. 通過XPATH獲取標籤的值
24. 的XPath不拾取DD標籤
25. 在td標籤中獲取div的xpath
26. 獲取HTML標籤
27. 取代HTML標籤
28. xpath只在標籤內抓取HTML註釋
29. PHP＆Xpath：獲取所有第一級HTML標籤（所有兄弟）
30. 從目標中提取html標籤的字符串中提取內容