2009-06-21 35 views
7

我覺得這個問題很簡單,我需要在基本平面之後的所有其餘的東西在Unicode的東西嗎?包含什麼樣的東西,是真的需要嗎? (用於什麼目的?)我需要輔助飛機嗎?

謝謝。

回答

10

如果您打算在中國銷售任何產品,那麼GB 18030標準是強制性的,並且要求超出BMP(基礎多語種平面)以外的字符。該標準已得到執行,爲了在那裏銷售,您需要通過GB 18030認證。

日本和香港也有國家標準,要求字符超出BMP。 即使這些標準不像中國人那樣執行,支持它們可能會給你一些優勢。

所以簡單的答案是:你需要一些東西。

=== 2016 ===

那是7年前。現在大家都在談論emojis。那麼,大多數表情符號都超出了BMP :-)

+0

除了認證問題之外,Unihan IICore字符集包含當前現代用法的所有漢字(中文,日文,韓文),其中包含62個補充表意平面(SIP)字符, – 2010-07-29 14:31:42

2

查看complete list of character charts

補充字符當前包含古代腳本。除非你有一個應用程序,可以處理Kharoshthi,Old Persion和Cuneiform等古代腳本,那麼可能不是

我想如果您遇到未完成的UTF-8或UTF-16實現,您只需處理此問題。 UTF-8的某些實現不支持4字節字符,它是輔助平面:U + 10000以上的字符。想到MySQL

+0

其實我正在使用MySQL,這就是我問的原因。我想知道是否使用Binary或UTF-8表格。謝謝。 – Tower 2009-06-21 13:43:30

7

這取決於您是否控制您的數據。如果您使用的是除您以外的任何人的Unicode數據,則通常必須假定它可能包含補充字符,這意味着您需要處理4字節的UTF-8,UTF-16替代字符等等。

+1

很好的回答!所以很少有人根本就不瞭解這個關於數據出處的基本原理。 – hippietrail 2013-05-30 02:09:50

2

如果可能的話,您應該嘗試支持包括補充平面在內的所有Unicode。現在有生活語言坐在補充飛機上,如Miao。將來會增加其他生活語言,目前有些語言需要輔助私人使用區域。然後還有Mihai Nita在他的answer中說過的話。

MySQL,從5.5開始,還有supports補充飛機。

最好現在花一點時間來全面支持Unicode,以便將來如果您真的需要它,那麼您將不會遇到任何問題。而且你不知道誰會使用你的軟件,以及他們將來會使用哪些腳本。現在大多數渲染引擎,GUI工具包,瀏覽器,操作系統等都可以毫無困難地支持這一點。

雖然這個問題在幾年前被問過,但我在搜索中遇到了這個問題,並且從那時起事情就發生了變化。我目前正在處理程序員認爲不需要補充飛機支持或者未經測試的問題。