我只是想把那些標籤拿出來。 Hrpicot.XML有這個方法嗎?如何從使用Hpricot的XML文本中刪除<![CDATA[ ]]>標籤?
4
A
回答
6
使用element.inner_text代替#inner_html並刪除他們爲你
2
doc.search("*") do |element|
element.swap element.content if element.kind_of? Hpricot::CData
end
1
doc = Hpricot::XML(open('http://www.cnn.com/.element/ssi/www/auto/2.0/video/xml/most_popular.xml'))
(doc/:cnn_video/:video).each do |status|
['tease_txt'].each do |el|
puts "#{status.at(el).inner_text}"
end
end
輸出示例(貌似垃圾,但這不是垃圾郵件!):
新裏諾空氣碰撞視頻顯示影響
青少年捕獲800磅重的鱷魚
恢復職業發佈'別問'廢止
名令人毛骨悚然裙偷窺者
巴士大小的衛星撞擊地球THI ...
「DWTS」投命中舞廳首次
在什麼造成的海洋世界教練的死亡?
是什麼導致特洛伊戴維斯寬大否認?
相關問題
- 1. 如何使用Hpricot使用<br />標籤從網頁中提取文本?
- 2. 我想在xml中刪除<![CDATA[ ]]>?
- 3. 刪除<![CDATA [標籤從xml webserivce響應
- 4. Howto刪除CDATA元素中的HTML <a>標籤
- 5. <![CDATA[]>在XML標記
- 6. 如何刪除``<![CDATA [`和結束`//]]>?
- 7. 從xml中刪除<xmp>標記
- 8. 如何刪除XML :: Simple輸出中的<opt>標籤?
- 9. 如何刪除XElement的CDATA標籤?
- 10. 刪除<![CDATA [使用WSO2從WebService響應中刪除]
- 11. 如何從<content:encoded>標籤中的XML獲取2個CDATA值?
- 12. 如何刪除<script>之間的文本</script>標籤
- 13. 刪除<style>標籤<head>
- 14. 如何從Java中的StringBuilder中刪除<br>標籤?
- 15. 如何從文本中移除<a>標籤?
- 16. 如何從字符串中刪除`/!<![CDATA [`和end`//]]>``javascript?
- 17. 如何使用jSoup從<%@ include view =「MirrorPage」%>中刪除文本
- 18. 在XML中,<![CDATA [<![CDATA [some text]]]]><![CDATA[>]]>是什麼意思?
- 19. 如何使用Powershell刪除xml文件中的<w:documentProtection ... />行?
- 20. 從rss(xml)源刪除CDATA標記
- 21. 刪除<腳本類型=「JavaScript的」> ABCD</script>標籤
- 22. 在DataPower中從XML中刪除CDATA
- 23. 如何從響應中刪除「<?xml ...>」標記?
- 24. 如何使用時刪除HTML標籤的<bean:寫/>
- 25. 如何從HTML表格中刪除<tbody>標籤?
- 26. 如何使用java從SOAP響應中刪除(<)和([CDATA [[))?
- 27. 如何從Zend FormErrors中刪除默認<b></b>標籤
- 28. 如何使用as3刪除xml標籤
- 29. Gmail刪除標籤例如<audio>
- 30. 在TestLink XML文件中從CDATA中刪除HTML標記
你可能會想一個#inner_text.strip擺脫(幾乎可以肯定)多餘的空白。 – Simon 2013-01-28 16:07:57