我知道這有點含糊,所以在上下文中,可以把它想象成「你可以發推文的角色」或類似的東西。我的問題是,支持utf8的瀏覽器或服務可以解析多少個有效的unicode字符,這樣utf8瀏覽器就可以複製並粘貼它,而不會出現任何問題。有多少有效的utf8字符?
我想我不想要的是全角字符空間,因爲我知道它有很多保留給不會顯示的命令字符或保留字符(除非我超級錯誤!)。
我知道這有點含糊,所以在上下文中,可以把它想象成「你可以發推文的角色」或類似的東西。我的問題是,支持utf8的瀏覽器或服務可以解析多少個有效的unicode字符,這樣utf8瀏覽器就可以複製並粘貼它,而不會出現任何問題。有多少有效的utf8字符?
我想我不想要的是全角字符空間,因爲我知道它有很多保留給不會顯示的命令字符或保留字符(除非我超級錯誤!)。
UTF-8不是重要的因素,因爲所有的標準Unicode編碼(UTF-8,UTF-16,UTF-32)都以不同的方式編碼相同的字符空間。
從你的解釋我看你不只是想要1,112,064有效的Unicode代碼點?
Unicode 6.0和ISO/IEC 10646:2010定義了109,449個字符,但少數這些就是你所說的「控制字符」。哪些屬於或不屬於該類別取決於你如何計算。複製和粘貼可能會導致某些字符被視爲彼此相同或完全忽略,具體取決於操作系統和執行復制和粘貼的程序。
但是,由於Unicode是向前兼容的,某些系統將正確保留尚未分配的字符。畢竟,僅僅因爲你運行的是Windows XP,並且你複製並粘貼了一個文件,這些文件中的字符不是標準化的,直到2009年並不意味着你期望它們消失。通過這種思維方式,可能會有一百萬左右的可能性,儘管他們的視覺外觀在某些地方可能難以區分。
如果某個字符在Unicode規範中列出,則它具有有效的UTF-8表示形式。如果unicode codepoint遵循規範,那麼它是有效的。所以,是的,循環邏輯。這是有效的,因爲它不是無效的。 –
無法知道顯示設備是否支持具有指定代碼點的字體,或者甚至無法確定顯示設備是否支持具有指定代碼點的字體。你不會相信有多少字體將字體組合在一起,而不是總是以相同的方式。 – tchrist