11
A
回答
13
按照Wikipedia article on GB18030的規定,「GB18030可以被認爲是與傳統字符集保持兼容性的Unicode轉換格式(即所有Unicode代碼點的編碼)。」也就是說,所有的Unicode字符都可以用GB18030編碼,但它們將用不同於UTF-8或UTF-16生成的字節序列進行編碼。處理GB18030編碼不需要比任何其他非Unicode編碼所需的更多特殊技術。
ICU project是一個開放源碼庫(用於C或Java),完全支持許多不同的編碼,包括GB18030。關於在不同的編碼與ICU之間轉換的信息可以在here找到。
+0
感謝您的信息。我對ICU有適度的瞭解;雖然我不知道它也處理GB18030。 – 2008-10-23 03:36:35
12
處理GB18030需要哪些特殊技術?
要注意的最大的問題是,與UTF-8不同,GB18030允許ASCII字節在多字節字符的編碼中出現。 (例如,'ß'被編碼爲字節81 ,其中包含'0'和'8'的ASCII編碼。)這意味着您不能使用簡單的面向字節的find
/index
函數。
相關問題
- 1. ASCII和Unicode區別
- 2. 帶有wxWidgets的C++,Unicode與ASCII,有什麼區別?
- 3. logcat與dmesg有何區別?
- 4. 與這款剃鬚刀有何區別?
- 5. 繼承與類別有什麼區別
- 6. CSS三角形與unicode的瀏覽器渲染/定位區別
- 7. GB18030代碼頁MSDN(C++)
- 8. RegExp,unicode和javascript。我如何分辨「\ u306E」與字符「の」之間的區別?
- 9. GC = Mark和GC = Unicode常規類別中的標點符號有什麼區別?
- 10. DocBook與HTML - 區別
- 11. DOM與XPath - 區別?
- 12. 點與!的區別
- 13. 「或」與「||」的區別
- 14. HTML與XML - 區別
- 15. C++與C區別&*
- 16. 區別與膚色
- 17. Nhibernate和SubSonic有何區別?
- 18. MonoTouch和MonoDevelop有何區別?
- 19. MySQLi和PDO有何區別?
- 20. 4GL和DSL有何區別?
- 21. DELETE_ORPHAN和DELETE有何區別?
- 22. bcpow和pow有何區別?
- 23. V8和ES8有何區別
- 24. PopUpWindow和Dialog有何區別?
- 25. ifne和ifnonnull有何區別?
- 26. Ntxxx和ZWxxx有何區別?
- 27. MXML和Actionscript3有何區別
- 28. Progressbar和progressDialog有何區別?
- 29. Date.current和Date.today有何區別?
- 30. RMI和Corba有何區別?
您將字符集(如Unicode)與字符編碼方案(如GB18030,ISO Latin-1..15,UTF- [7,8,16,32])混淆。 – Sebastian 2014-06-13 11:16:50