有人可以確認中文中的所有漢字字符都是UTF-8中的3個字節長嗎?UTF-8中的所有漢字字符都是3字節長嗎?
17
A
回答
27
常用的漢字/漢字字符在U + 4E00和U + 9FFF之間的「CJK統一表意文字」區塊中,UTF-8佔用3個字節。 (日本平假名和片假名字符也需要3個字節。)
但是,也有在「CJK統一漢字擴展B」一些非常很少使用的字符和「CJK兼容表意文字補編」塊,其採取4個字節在UTF-8。
另請注意,中文文本通常包含ASCII字符,如數字0-9。
2
是的,漢字是U + 4e00到U + 9faf,UTF8 3字節是U + 0800到U + FFFF。
相關問題
- 1. UTF8中的漢字?
- 2. 多字節的UTF8字符
- 3. 流到UTF8字符串,沒有字節[]
- 4. 是否有用於UTF8字符的分隔符字節?
- 5. unicode字節中的特殊字符比iso字節長嗎?
- 6. 查找字符串中的所有3個字符長度的子字符串
- 7. [NSString substringWithRange]中的錯誤如果字符是4字節長度的UTF8?
- 8. 字符串的所有字符都屬於一個集合嗎?
- 9. 如何強制yaml中的所有節點都是字符串
- 10. 刪除4個字節的UTF8字符
- 11. UTF8字符串長度
- 12. 替換utf8中的所有非單詞字符字符串
- 13. 如何檢查字符串中的所有字符是否都是字母?
- 14. 將字節轉換爲UTF8編碼的字符串安全嗎?
- 15. php可以檢測4字節編碼的utf8字符嗎?
- 16. 將字節[]轉換爲UTF8字符串
- 17. UTF8字節到字符串和Winsock GetStream
- 18. 將字符串轉換爲utf8字節
- 19. 獲取UTF8中字符串的長度
- 20. mysql可以正確顯示utf8中的所有字符嗎?
- 21. C#UTF8解碼,返回字節/數字而不是字符串
- 22. 的Javascript所有的話是3個字符或更長
- 23. xslt中字符串的字節長度
- 24. 閱讀UTF8字符使用的innerHTML返回0xfffd所有字符
- 25. 如何從字符串中替換所有漢字?
- 26. 所有非打印字符是否都控制字符?
- 27. 有效字符在字符集UTF8
- 28. .NET系統::字符串到UTF8字節存儲在字符*
- 29. 字符串中的所有字符都被轉義
- 30. 我使用PHPrunner但所有字符串字段都是空的
+1哇,顯然我們有中文使用者在計算器上。酷:-)。 – sleske 2010-09-10 09:17:11
源自Shift-JIS的日文文本也可能包含映射到雙字節序列的其他非漢字,非ASCII字符。然後,我們很快就會有表情符號與之競爭,這也在基礎多語言平面之外,所以4字節... – bobince 2010-09-10 11:28:30
@sleske:不,我不會說*中文。我在字符編碼方面做了太多工作。 – dan04 2010-09-10 13:17:17