2016-07-15 48 views
0

如何將Unicode(如字符)向上箭頭分配給wchar_t變量?將Unicode分配給wchar_t變量

+2

'wchar_t的變量= L'\ u1234';'(用所需的Unicode代碼點替換1234)。 –

+0

@IgorTandetnik絕對正確,這是唯一可靠的方法。如果您需要查找Unicode代碼點值,只需Google即可。例如,下面是一個箭頭頁面:https://en.wikipedia.org/wiki/Template:Unicode_chart_Arrows –

+1

字符直接賦值在Windows上對代碼點U + 10000及以上無效,因爲'wchar_t'爲16位。在這種情況下,您需要使用佔用兩個'wchar_t'的代理對。 – Sergio

回答

0

wchar_t可能在Linux上是32位,但在Windows 16位上,UTF-16LE編碼有時需要兩個wchar_t來存儲一個Unicode代碼點。

UTF-16LE和UTF-16BE不是線性的,具有不能分成兩個字符串的對。而wchar_t是不可移植的。

因此更好使用UTF-8和char

void append_utf8(string& s, uint cp) { 
    if (cp < 0x80 && cp != 0) { 
     // Let encode U+0 too (Modified UTF-8), as non-terminator? 
     s.append(1, (char) cp); 
    } else { 
     char cpBytes[6]; 
     int bi = 0; 
     int lastPrefix = 0xC0; 
     int lastMask = 0x1F; 
     for (;;) { 
      int b = 0x80 | (cp & 0x3F); 
      cpBytes[bi] = (char)b; 
      ++bi; 
      cp >>= 6; 
      if ((cp & ~lastMask) == 0) { 
       cpBytes[bi] = (char) (lastPrefix | cp); 
       ++bi; 
       break; 
      } 
      lastPrefix = 0x80 | (lastPrefix >> 1); 
      lastMask >>= 1; 
     } 
     while (bi > 0) { 
      --bi; 
      s.append(1, cpBytes[bi]); 
     } 
    } 
} 

string s; 
append_utf8(s, 0x2191): // For U+2191 up arrow. 
append_utf8(s, 0x1F913): // For U+01F913 emoji nerd face. 

對於Windows類似寬字符(UTF-16):

void append_wch(std::wstring& s, uint cp) { 
    if (cp < 0x10000) { 
     s.append(1, (wchar_t) cp); 
    } else { 
     cp -= 0x10000; 
     uint w = (cp >> 6) + 0xD800; 
     s.append(1, (wchar_t) w); 
     w = (cp & 0x3FF) + 0xDC00; 
     s.append(1, (wchar_t) w); 
    } 
} 

(心,我與Java的影響污點)

+1

Windows API是UTF-16,因此在該平臺上使用UTF-8需要大量額外的工作。請參閱http://utf8everywhere.org/ –

+0

@MarkRansom是的,只有Windows的桌面開發可能就是OP所需要的。謝謝 –