2012-09-02 139 views
0

這裏是一段HTML來解析:如何獲取HTML/XML中的屬性?

<td style="text-align:center; color:black; background:#ff6666; border:2px solid #8811ff;" title="Alkali metals; Primordial; Solid"> 
37 
<br /> 
<a title="Rubidium" href="/wiki/Rubidium">Rb</a> 
</td>` 

我可以xmlValue得到的值。 我得到的是:

text br a 
"19" "" "K" 

但我想屬性的值,在tdtitle屬性,價值「鹼金屬;原始;固體」atitle屬性,數值爲「銣」

我該如何得到它?

+0

BTW:maybe [this](http://stackoverflow.com/questions/4393780/scraping-a-wiki-page-for-the-periodic-table-and-all-the-links)SO問題對你有幫助。 – sgibb

回答

3

您可以使用xmlAttrsxmlGetAttr(詳情請參閱?xmlAttrs)。

html <- '<td style="text-align:center; color:black; background:#ff6666; border:2px solid #8811ff;" title="Alkali metals; Primordial; Solid">37<br /><a title="Rubidium" href="/wiki/Rubidium">Rb</a></td>' 
td <- xmlRoot(xmlParse(html)) 
xmlAttrs(td)["title"] 
# "Alkali metals; Primordial; Solid" 
xmlAttrs(xmlChildren(td)$a)["title"] 
# "Rubidium 

# or 
xmlGetAttr(td, "title") 
# "Alkali metals; Primordial; Solid"