從Nokogiri::XML::DocumentFragment
中刪除所有標籤的簡單方法是什麼?只保留空格分隔的文本?如何將HTML標記轉換爲純文本?
我想改造:
Hello<br>My name is McOmghall
到:
Hello My name is McOmghall
我的解決辦法是:
Nokogiri::XML.fragment(html_text).children.to_a.flatten.select { |node| node.class == Nokogiri::XML::Text}
,然後串聯數組將每個元素之間的空間,但我認爲它不是最理想的,也不是很清楚。
編輯:
這是我的最終解決方案:
Nokogiri::XML.fragment(html_text).xpath('.//text()').map(&:text).join(' ')
是否要替換原有文檔或僅輸出所提到的格式?這是一個混亂.. –
只有輸出,但我不介意修改原來的。 –