将 Unicode 分配给wchar_t变量
Assigning an Unicode to a wchar_t variable
如何将字符向上箭头等Unicode
分配给wchar_t
变量?
wchar_t
在Linux上可能是32位,但在Windows 16位上,UTF-16LE编码,有时需要两个wchar_t来存储一个Unicode代码点。
UTF-16LE 和 UTF-16BE 不是线性的,具有不能拆分为两个字符串的对。而且wchar_t是不可移植的。
因此最好使用 UTF-8 和 char
.
void append_utf8(string& s, uint cp) {
if (cp < 0x80 && cp != 0) {
// Let encode U+0 too (Modified UTF-8), as non-terminator?
s.append(1, (char) cp);
} else {
char cpBytes[6];
int bi = 0;
int lastPrefix = 0xC0;
int lastMask = 0x1F;
for (;;) {
int b = 0x80 | (cp & 0x3F);
cpBytes[bi] = (char)b;
++bi;
cp >>= 6;
if ((cp & ~lastMask) == 0) {
cpBytes[bi] = (char) (lastPrefix | cp);
++bi;
break;
}
lastPrefix = 0x80 | (lastPrefix >> 1);
lastMask >>= 1;
}
while (bi > 0) {
--bi;
s.append(1, cpBytes[bi]);
}
}
}
string s;
append_utf8(s, 0x2191): // For U+2191 up arrow.
append_utf8(s, 0x1F913): // For U+01F913 emoji nerd face.
对于 Windows 上的宽字符 (UTF-16),如下所示:
void append_wch(std::wstring& s, uint cp) {
if (cp < 0x10000) {
s.append(1, (wchar_t) cp);
} else {
cp -= 0x10000;
uint w = (cp >> 6) + 0xD800;
s.append(1, (wchar_t) w);
w = (cp & 0x3FF) + 0xDC00;
s.append(1, (wchar_t) w);
}
}
(请注意,我受到Java的影响。
相关文章:
- 如何创建一个CMake变量,除非显式重写,否则使用默认值
- 将成员变量添加到共享库中的类中,不会破坏二进制兼容性吗
- 将数组的地址分配给变量并删除
- 为"adjacent"变量赋值时出现问题
- enum是C++中的宏变量还是整数变量
- 在全局变量中保存类的实例以重新创建类(创建"backup")
- 用C++中的一个变量定义一个常量
- 具有奇怪重复模板模式的派生类中的成员变量已损坏
- 你能重载对象变量名本身返回的内容吗
- 内置函数可查看CPP中的成员变量
- 是否可以初始化不可复制类型的成员变量(或基类)
- 尝试通过多个向量访问变量时,向量下标超出范围
- 试图让变量检查数组中的某些内容
- Cpp-Tuple使用带有变量的get
- 将包含C样式数组的对象初始化为成员变量(C++)
- 如何在 C++ 中的 wcstok 中使用常量 WCHAR* 变量?
- 在 c++ 中输入从字符串到 wchar 变量的值
- wchar /字符变量
- c++简单的方法将宏变量转换为wchar字符串文字
- 我如何将CHAR变量复制到c++中的WCHAR变量