是否有比CGI for Ruby更好的HTML轉義和轉義工具？

CGI.escapeHTML非常糟糕，但CGI.unescapeHTML完全是borked。例如：是否有比CGI for Ruby更好的HTML轉義和轉義工具？

require 'cgi' 

CGI.unescapeHTML('&#8230;') 
# => "…"     # correct - an ellipsis 

CGI.unescapeHTML('&hellip;') 
# => "&hellip;"    # should be "…" 

CGI.unescapeHTML('&#162;') 
# => "\242"     # correct - a cent 

CGI.unescapeHTML('&cent;') 
# => "&cent;"    # should be "\242" 

CGI.escapeHTML("…") 
# => "…"     # should be "&#8230;"

看來，unescapeHTML知道所有的數字代碼加&，<，>和"。而escapeHTML只知道最後四個 - 它不會執行任何數字代碼。我明白，轉義通常不需要像健壯的一樣，因爲HTML將允許大多數字符的字面版本，除了CGI.escapeHTML知道的四個以外。但是消遣應該真的會更好。

有沒有更好的工具在那裏，至少對於消除？

來源

2008-12-18 James A. Rosen

它不處理—無論是。 – Chloe 2014-03-15 01:32:41

的寶石ヶ輛應該做的伎倆：

require 'rubygems' 
require 'htmlentities' 

coder = HTMLEntities.new 

coder.decode('&#8230;') # => "…" 
coder.decode('&hellip;') # => "…" 
coder.decode('&#162;') # => "¢" 
coder.decode('&cent;') # => "¢" 
coder.encode("…", :named) # => "&hellip;" 
coder.encode("…", :decimal) # => "&#8230;"

來源

2008-12-20 18:17:41 titanous

require 'rubygems' 
require 'hpricot' 

Hpricot('&#8230;', :xhtml_strict => true).to_plain_text

雖然你可能不得不使用字符編碼。

來源

2008-12-18 23:21:06

使用htmlentities gem而不是hpricot。 – 2009-01-02 02:35:29

是否有比CGI for Ruby更好的HTML轉義和轉義工具？

回答

相關問題