4
有沒有簡單的方法從R中的字符串中刪除HTML標籤?從字符串中刪除HTML標籤(R編程)
目前我從XML文檔中提取出調查數據,問題標題中包含調查設計中的HTML,就像這樣。
"Why did you give this performance question a low score?<br />"
任何方式可以輕鬆地刪除<br />
?
任何幫助,將不勝感激。
有沒有簡單的方法從R中的字符串中刪除HTML標籤?從字符串中刪除HTML標籤(R編程)
目前我從XML文檔中提取出調查數據,問題標題中包含調查設計中的HTML,就像這樣。
"Why did you give this performance question a low score?<br />"
任何方式可以輕鬆地刪除<br />
?
任何幫助,將不勝感激。
看看?gsub
和?regex
。這裏有一些簡單的代碼來刪除<br />
,但它不適用於所有潛在的HTML標籤。對於
> string <- "Why did you give this performance question a low score?<br />"
> gsub("<.*/>","",string)
[1] "Why did you give this performance question a low score?"
謝謝,這讓我對我的方式找到「GSUB(‘<(.|\n)*?>’,‘’,字符串)」 – 2010-09-22 02:29:20
只是爲了標誌它可能是值得的正則表達式解析主題諮詢這個明智的建議html .. http://stackoverflow.com/a/1732454/1156245 – geotheory 2014-07-14 10:50:13