如何將代碼點32位整數數組（UTF-32？）轉換爲Windows本地字符串？

如何將代碼點32位整數數組（UTF-32？）轉換爲Windows本機字符串？在API級別上處理Unicode的Windows本機字符串類型是什麼？它能否正確處理'u65535'以外的角色？如何將代碼點32位整數數組（UTF-32？）轉換爲Windows本地字符串？

來源

2015-04-03 xiver77

它使用utf-16，一種可變長度編碼。通常LPWCSTR或WCHAR []在您的程序中。是。 – 2015-04-03 13:53:41

Windows使用UTF-16作爲其本機字符串類型。 UTF-16處理的代碼點高達U+10FFFF，使用替代對對U+FFFF以上的代碼點進行編碼。

Windows有沒有UTF-32概念，所以你必須要麼：

如果您正在使用C++ 11或更高版本，它具有天然的std::u16string和std::u32string類型和std::codecvt類的數據轉換UTF-8，UTF-16和UTF-32之間。

#include <string> 
#include <locale> 

std::u16string Utf32ToUtf16(const u32string &codepoints) 
{ 
    std::wstring_convert< 
     std::codecvt_utf16<char32_t, 0x10ffff, std::little_endian> 
     char32_t> conv; 
    std::string bytes = conv.to_bytes(codepoints); 
    return std::u16string(reinterpret_cast<char16_t*>(bytes.c_str()), bytes.length()/sizeof(char16_t)); 
}

如果您使用的是較早的C/C++版本中，你將不得不從UTF-32轉換爲UTF-16手動：

// on Windows, wchar_t is 2 bytes, suitable for UTF-16 
std::wstring Utf32ToUtf16(const std::vector<uint32_t> &codepoints) 
{ 
    std::wstring result; 
    int len = 0; 

    for (std::vector<uint32_t>::iterator iter = codepoints.begin(); iter != codepoints.end(); ++iter) 
    { 
     uint32_t cp = *iter; 
     if (cp < 0x10000) { 
      ++len; 
     } 
     else if (cp <= 0x10FFFF) { 
      len += 2; 
     } 
     else { 
      // invalid code_point, do something ! 
      ++len; 
     } 
    } 

    if (len > 0) 
    { 
     result.resize(len); 
     len = 0; 

     for (std::vector<uint32_t>::iterator iter = codepoints.begin(); iter != codepoints.end(); ++iter) 
     { 
      uint32_t cp = *iter; 
      if (cp < 0x10000) { 
       result[len++] = static_cast<wchar_t>(cp); 
      } 
      else if (cp <= 0x10FFFF) { 
       cp -= 0x10000; 
       result[len++] = static_cast<wchar_t>((cp >> 10) + 0xD800); 
       result[len++] = static_cast<wchar_t>((cp & 0x3FF) + 0xDC00); 
      } 
      else { 
       result[len++] = static_cast<wchar_t>(0xFFFD); 
      } 
     } 
    } 

    return result; 
}

使用第三方庫，如libiconv或ICU。

來源

2015-04-03 19:35:57

如何將代碼點32位整數數組（UTF-32？）轉換爲Windows本地字符串？

回答

相關問題