如何在char16_t字符串文本中编码 Unicode 点 U+10000
How do I codify the unicode point U+10000 in a char16_t string literal?
C++11标准中的第2.14.5p9段说(强调我的(:
以 u 开头的字符串文本(如 u"asdf"(是一种char16_t 字符串文字。char16_t字符串文本的类型为"n 常量数组" char16_t",其中 n 是字符串的大小,定义如下;它有 静态存储持续时间,并使用给定字符进行初始化。 单个 c-char 可能会char16_t在 代孕对的形式。
如何编纂 unicode 点 U+10000,它由char16_t字符串文字中的代理项对 D800(高代理项(和 DC00(低代理项(组成?
引用的文中上述c-char
是什么意思?
其实很简单:u"U00010000"
.如文中所述,单个 c-char(在本例中为 U00010000
(可以产生多个char16_t
。快速测试将显示u"U00010000"
的类型char16_t const[3]
(代理项对为 2 + 空终止符为 1(。
或者,您可以简单地将字符直接放在字符串中,如u" "
,假设源文件以编译器期望的编码保存。这将是完全相同的事情,因为对源文件执行的第一步是将基本字符集之外的任何字符替换为其通用字符名称(即 U00010000
(。
c-char 是"源字符集的任何成员,除了单引号 '
、反斜杠 或换行符",或转义序列(如
n
、 123
或 x41
(,或通用字符名称(如 u1234
或 U12345678
(。
标准文档在末尾附近有一个语法制作的索引,您可以使用它来查找这些内容。
相关文章:
- 如何确定我已使用非编码文件到达 EOF?
- C++ - Unicode Newline
- 如何在 c++ 中读取用 utf-8 编码的 java unicode 字节字符串
- 读取 CSV 文件(UNICODE 编码)C++时出现编码错误
- 为什么 unicode 编码需要函数 wsetlocale()
- Windows的unicode数据类型使用什么unicode编码(UTF-8、UTF-16等)
- C/C++ 将编码设置为 UNICODE。如何将'ă'写入文件
- 这是怎麽?在读取使用 Unicode 编码的文本文件后控制台输出的开头
- 使用 Unicode 编码从 txt 文件读取 -- C++/C#
- std::string 和 UTF-8 编码的 unicode
- UTF-8 Unicode 编码和国家/地区特定字符
- unicode或任何其他编码数据是如何存储在内存中的?(win32)
- 如何在char16_t字符串文本中编码 Unicode 点 U+10000
- 从多字节编码到Unicode的转换
- 如何将Unicode字符转换为HTML编码
- 我怎么能得到QT主函数argv参数作为unicode编码格式
- c++ 11中字符串字面值的Unicode编码
- C++字符串编码UTF8 /Unicode
- 库的字符串编码是否符合Unicode或灵活
- 如何检测ICU中的一种编码是否支持unicode字符