3
我有一個問題,其中xmlValue
條,我需要保持(或轉化爲某些其它字符,我可以然後strsplit
上<br />
標籤防止`xmlValue`從汽提<br />標籤
下面是一個例子:
> f <- htmlParse(getForm("http://sites.target.com/site/en/spot/store_locator_popups.jsp", ajax="true", storeNumber=1889), asText=TRUE)
> xpathSApply(f, "//div[@class=\"sl_results_popup_address\"]", xmlValue)
[1] "1154 S Clark StChicago, IL 60605(312) 212-6300"
對戰它解析HTML:
<div class="sl_results_popup_address">
1154 S Clark St
<br/>
Chicago, IL 60605
<br/>
(312) 212-6300
</div>
我試過, recursive=FALSE
BU這似乎沒有幫助。
如果他們是<p>
和</p>
換行符,那麼它會更容易,因爲我可以單獨抓住他們,但<br/>
沒有包裝文本我真的不能走這個方向。希望在xmlValue
(或者<br/>
正在剝離文檔解析階段?)內只有一個選項可以降低剝離級別?
兩個可愛的方案。謝謝。我沒有想過text()。仍然習慣xpath。很多學習,一如既往。 – 2012-07-31 14:27:12
我從FireBug複製了代碼,所以也許這就是差異的來源。 – 2012-07-31 15:51:22