2017-05-29 117 views
-1

我想在C++中學習unicode處理。我將使用UTF-8作爲編碼,但我的問題與編碼無關。有效的Unicode字符串

問題很簡單:是否有任何代碼序列指向一個有效的unicode字符串?

我之所以問這個問題是因爲A可被表示爲U+00C5或2個編碼點U+0041(A),U+030A(以上環)的序列。這讓我想知道一個代碼點U+030A(上面的環)的序列是否是一個有效的unicode字符串。事實證明,我已經能夠在Linux下創建一個具有該名稱的文件名,但我不確定它是否是一個有效的Unicode字符串。

+0

這不是一個真正的C++特定問題,對吧? – Rakete1111

+0

Rakete1111:你說得對。我已經刪除了C++標記。 – InsideLoop

+0

我的建議是根本不處理Unicode,而是使用庫。 –

回答

0

這使我懷疑一個碼點U+030A(上環 ),沒有收到任何的序列,是一個有效的Unicode字符串

問題是無效的,因爲U+030A不是一個字符串,但一個代碼點。但是,是的,假設您將此代碼點正確編碼爲相關編碼,如果此代碼點單獨出現,則不存在任何問題。它不需要任何東西。

事實證明,我已經能夠Linux的

下創建的文件名與該名 這並不意味着蹲下。

+0

David Haim :我的問題是關於包含一個unicode點的unicode字符串,而不是unicode點。感謝您的回答。 – InsideLoop