如何C++ WCOUT UTF-16 编码的字符数组?
how can C++ wcout utf-16 encoded char array?
我正在阅读关于字符串和wstring的著名答案,并遇到了一些困惑。
源字符集和执行字符集均设置为UTF-8,Windows x64,VC++编译器,git bash控制台(可以打印Unicode字符(,系统默认代码页936(GB2312(。
我的专家代码:
#include <cstring>
#include <iostream>
using namespace std;
int main(int argc, char* argv[])
{
wchar_t c[] = L"olé";
wchar_t d[] = L"abc";
wcout << c << endl;
wcout << d << endl;
return 0;
}
可以打印">abc",但不能打印"é"。
我知道wchar_t
与L
前缀字符串文字一起使用。在Windows下wchar_t
用UTF-16编码(这是硬编码的吧?无论我选择什么源字符集或执行字符集,L"abc"
总是具有相同的 UTF-16 代码单元(。
问题是:它怎么能wcout
一个 UTF-16 编码的字符串("abc"(,而我的源文件是 utf-8,执行字符集是 utf-8。该程序应该无法识别 UTF-16 编码的内容,除非我将所有内容都设置为 utf-16。
如果它可以以某种方式打印 UTF-16,那么为什么它不能打印é
?
您需要非标准的 Windows 系统调用才能启用 UTF-16 输出。
#include <iostream>
#include <io.h>
#include <fcntl.h>
#include <stdio.h>
int main()
{
_setmode(_fileno(stdout), _O_U16TEXT); // <=== Windows madness
std::wcout << L"olén";
}
请注意,执行此操作后不能使用cout
,只能使用wcout
。
另请注意,源代码文件必须具有 BOM,否则编译器将无法将其识别为 Unicode。
Windows 控制台不支持 UTF-16 输出。 它仅支持 8 位输出,并且部分支持 8 位 MBCS,例如 Big5 或 UTF-8。
要在控制台上显示 Unicode 字符,您需要在代码中转换为 UTF-8 或其他 MBCS,并将控制台置于 UTF-8 模式(这需要未记录的系统调用(。
另请参阅此答案
相关文章:
- 指向指向字符数组的指针数组的指针
- 比较字符数组
- 如何使用Crypto++并为RSA返回可打印的字节/字符数组
- 使用无符号字符数组有效存储内存
- 错误:字符数组的初始值设定项太多
- 对字符数组中的元素执行逐位操作
- C++ 无法在字符数组中使用 for 循环打印字母模式
- 如何在 C++ 中从文件中读取字符数组(带有一些空格)
- C++ 传递二维字符数组
- 无法在 C++ 中输入字符数组
- 字符数组中的元素数
- 我的目标是编写一个程序来计算和存储字符串在字符数组中出现的位置
- 使用字符数组作为 Map 中的键
- C++:__aligned(__alignof__) 导致字符数组数据出现问题?
- 按顺序声明的字符数组重叠
- 在 C++ 中字符串的大小与字符数组的大小
- 寻找一种更好的方法来表示无符号字符数组
- 如何打印 2D 字符数组C++
- 从字符数组的元素中减去'a'是什么意思
- 我是否不正确地集中了这些字符数组?