8
A
回答
23
doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_s
+0
謝謝!工作正常+1 – rusllonrails 2017-11-25 13:42:43
5
使用Sax解析器。比XPath選項快得多。
require "nokogiri"
some_html = <<-HTML
<html>
<head>
<title>Title!</title>
</head>
<body>
This is the body!
</body>
</html>
HTML
class TextHandler < Nokogiri::XML::SAX::Document
def initialize
@chunks = []
end
attr_reader :chunks
def cdata_block(string)
characters(string)
end
def characters(string)
@chunks << string.strip if string.strip != ""
end
end
th = TextHandler.new
parser = Nokogiri::HTML::SAX::Parser.new(th)
parser.parse(some_html)
puts th.chunks.inspect
+0
這怎麼可能被改變爲僅在body標籤之間獲取文本? – Omnipresent 2010-12-11 16:27:53
+0
設置一個標誌,並且只有在身體標籤關閉後才能看到身體標籤開始和停止捕捉後纔開始捕捉角色。 – 2010-12-13 00:35:11
1
這裏是如何讓所有的文字在這個頁面的問題DIV:
require 'rubygems'
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open("http://stackoverflow.com/questions/1512850/grabbing-text-between-all-tags-in-nokogiri"))
puts doc.css("#question").to_s
2
只要做到:
doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").text
相關問題
- 1. 提取標籤之間的所有值
- 2. 獲取html標籤內/ html標籤之間的所有內容
- 3. 使用BeautifulSoup抓取標籤之間的文本
- 4. 獲取兩個不同標籤之間的所有字符串
- 5. Objective-C HTML解析。獲取標籤之間的所有文本
- 6. 的Python:提取所有的子串在標籤之間串
- 7. 獲取HTML標籤之間的所有元素在PHP
- 8. 有沒有辦法在DOM中的HTML標籤之間提取文字逐字?
- 9. JSoup-在標籤之間獲取文本
- 10. 裹在PHP H3標籤集合與DOM文檔之間的所有HTML標籤
- 11. 如何更改兩個標籤之間的一些文字與Nokogiri?
- 12. 使用Nokogiri來選擇所有<span>標籤之間的隨機選擇<br>標籤
- 13. 提取標籤之間的文本
- 14. 提取在兩個標籤之間更改的所有文件或更改集
- 15. 如何提取2個標籤之間的文字在php
- 16. 如何獲取html標籤之間的所有元素?
- 17. 獲取2個XML標籤之間的所有值
- 18. 使用引入nokogiri獲取兩個標記之間的文本
- 19. 用vim替換標籤之間的所有字符實例
- 20. 使用Nokogiri抓取漢字網頁
- 21. 如何使用Nokogiri獲取包含特定標籤的所有文本?
- 22. 如何使用BeautifulSoup在兩個指定標籤之間獲取所有文本?
- 23. 獲取標籤之間的所有字符串並回顯它們?
- 24. PHP/Regex - 抓取{和}之間的所有內容?
- 25. Nokogiri只抓取可見inner_text
- 26. 在PowerShell中獲取2個字符之間的所有文本
- 27. Python字符串操作,提取html標籤之間的文本
- 28. C從html文件中提取標籤之間的字符串
- 29. 從數字之間抓取整個詞
- 30. 抓取所有標籤從混帳遠程拉
退房https://github.com/rgrove/消毒也 – Abram 2015-05-31 02:07:19