如何使用C++将ucs4转换为ucs2,并将ucs2转换为ucs4

how to convert ucs4 to ucs2 using C++ and ucs2 to ucs4?

本文关键字:ucs2 转换 ucs4 并将 何使用 C++      更新时间:2023-10-16

是否有任何C++方法支持此转换?到目前为止,我只填充字符"0"来将ucs2转换为ucs4,这安全吗?谢谢

这对UCS2来说是正确的,但很可能不是您所拥有的。如今,你更可能遇到UTF-16。与UCS-2不同,UTF-16将Unicode字符编码为一个或两个16位单元。这是必要的,因为Unicode在其当前版本中有超过65536个字符。

更复杂的转换通常可以由操作系统完成,并且有几个(非标准)库提供相同的功能,例如ICU。

我有这样的东西。希望它能有所帮助:

String^ StringFromUCS4(const char32_t* element, int length)
{
    StringBuilder^ result = gcnew StringBuilder(length);
    const char32_t* pUCS4 = element;
    int characterCount = 0;
    while (*pUCS4 != 0)
    {
        wchar_t cUTF16;
        if (*pUCS4 < 0x10000)
        {
            cUTF16 = (wchar_t)*pUCS4;
        }
        else 
        {
            unsigned int t = *pUCS4 - 0x10000;
            unsigned int h = (((t << 12) >> 22) + 0xD800);
            unsigned int l = (((t << 22) >> 22) + 0xDC00);
            cUTF16 = (wchar_t)((h << 16) | (l & 0x0000FFFF));
        }
        result->Append((wchar_t)*pUCS4);
        characterCount++;
        if (characterCount >= length)
        {
            break;
        }
        pUCS4++;
    }
    return result->ToString();
}