2010-11-08 47 views
1

我需要從html文檔讀取一些測試數據。問題是有一些非英文字符顯示爲HTML代碼(例如Ø-Ø)。我怎樣才能將這些變成單個角色?稍後,我需要將這些字符與用戶在Web表單中輸入的內容進行比較。將HTML代碼(如Ø)存儲爲字母

我想在Ruby 1.9.2中做這個。

在此先感謝

回答

1

這個問題是在這麼多次。但我找不到它。所以,在我的記憶:

require 'CGI' 
some_string = 'Ø&>' 
p CGI.unescapeHTML(some_string).gsub(/&#(\d+);/){[$1.to_i].pack 'U'} 

=> "\u00D8&>" 

\u00D8是您的象徵。 &>只是例如使用CGI::unescapeHTML

相關問題