我有一個表單字段,允許多達120個字符,並且還接受所有UTF-8 Unicode字符集,包括特殊字符,數字字符和Alpha字符以提供國際字符。它應該忽略前導和尾隨空格UTF-8字符集
由於我主要使用有限的ASCII集,我不確定UTF-8會包含什麼。
請你指導一下ASCII/UTF-8的基本差異,以及在上述要求下應該允許的完整字符集。
謝謝。
我有一個表單字段,允許多達120個字符,並且還接受所有UTF-8 Unicode字符集,包括特殊字符,數字字符和Alpha字符以提供國際字符。它應該忽略前導和尾隨空格UTF-8字符集
由於我主要使用有限的ASCII集,我不確定UTF-8會包含什麼。
請你指導一下ASCII/UTF-8的基本差異,以及在上述要求下應該允許的完整字符集。
謝謝。
簡而言之,UTF-8是US-ASCII的超集。 ASCII中的任何字符都可以用UTF-8表示,並使用相同的位表示。 UTF-8是Unicode的一種表示形式,它允許表示任何當前定義的字符。
ASCII只包含128個字符,最新版本的Unicode包含超過109,000個字符,覆蓋93個腳本。
http://en.wikipedia.org/wiki/ASCII - 約ASCII
http://en.wikipedia.org/wiki/Unicode充分說明 - 有關Unicode
維基文章http://unicode.org/charts/ - Unicode的圖表列表
Thx很多...既然charset是如此之大,是否有任何標準的方式來編寫正則表達式來滿足我在utf-8中需要的? – testndtv
你有沒有讀過這個嗎? http://www.exelonsoftware.com/articles/Unicode.html – Mic