我的任務是獲取沒有數據的文檔的HTML結構。來源:使用Nokogiri獲取HTML結構
<html>
<head>
<title>Hello!</title>
</head>
<body id="uniq">
<h1>Hello World!</h1>
</body>
</html>
我想:
<html>
<head>
<title></title>
</head>
<body id="uniq">
<h1></h1>
</body>
</html>
有多種方式與引入nokogiri提取數據,但我無法找到一種方法執行相反的任務。
UPDATE: 找到解決的辦法是我收到的兩個答案的組合:
doc = Nokogiri::HTML(open("test.html"))
doc.at_css("html").traverse do |node|
if node.text?
node.remove
end
end
puts doc
輸出正是一個我想要的。
可能重複[?如何創建使用引入nokogiri頁面上的HTML代碼結構的輪廓(http://stackoverflow.com/questions/7176094/how- do-i-create-an-html-tag-structure-on-the-page-using-nokogiri) – Phrogz