1
我需要從html文檔讀取一些測試數據。問題是有一些非英文字符顯示爲HTML代碼(例如Ø-Ø
)。我怎樣才能將這些變成單個角色?稍後,我需要將這些字符與用戶在Web表單中輸入的內容進行比較。將HTML代碼(如Ø)存儲爲字母
我想在Ruby 1.9.2中做這個。
在此先感謝
我需要從html文檔讀取一些測試數據。問題是有一些非英文字符顯示爲HTML代碼(例如Ø-Ø
)。我怎樣才能將這些變成單個角色?稍後,我需要將這些字符與用戶在Web表單中輸入的內容進行比較。將HTML代碼(如Ø)存儲爲字母
我想在Ruby 1.9.2中做這個。
在此先感謝
這個問題是在這麼多次。但我找不到它。所以,在我的記憶:
require 'CGI'
some_string = 'Ø&>'
p CGI.unescapeHTML(some_string).gsub(/&#(\d+);/){[$1.to_i].pack 'U'}
=> "\u00D8&>"
\u00D8
是您的象徵。 &>
只是例如使用CGI::unescapeHTML
。