获取unicode代码点的大写或小写(如uint32_t)
Getting the upper or lower case of a unicode code point (as uint32_t)
是否有一种方法可以获得给定unicode代码点(或等效的utf-8代码单元序列)的大写或小写字符?
我读到这可以用ICU完成,但这将是我唯一需要ICU的事情,所以我不想为单个功能导入整个庞大的库(带有其许可证和依赖项,如果有的话)。
我还读到大写和小写取决于语言环境。这到底是什么意思?
谢谢你的帮助。
PS:不能使用c++ 11,使用VS2005
ICU是合适的工具。大小写折叠(多个符号代表同一个"字母"的想法)在一般形式下是一个棘手的概念。
i
的大写形式是什么?我们在哪个国家,我们用什么语言写作?英语有一对Ii
。土耳其语有两对:İi
和Iı
。所以它不是那么简单,并且解释了"区域设置问题"的部分问题。
另一个有趣的例子是德语ß
的大写(Eszett或英语中的"尖S")。它的大写形式是两个字母,SS
。因此,不能保证大写形式的字符串中包含相同数量的字母。
可能有一些小的库只关注案例折叠,但我不知道。一般来说,要合理地使用Unicode,你必须使用大量的Unicode。
相关文章:
- C++我的数学有什么问题,为什么我的代码不能正确循环
- 代码在main()中运行,但在函数中出现错误
- 在VS代码中交叉编译Windows与Linux上的MinGW的SDL程序
- 编译包含字符串的代码时遇到问题
- 我在c++代码中生成了一个运行时#3异常
- 如何在linux终端中同时编译和运行c++代码
- 为cl.exe(Visual Studio代码)指定命令行C++版本
- 在Linux for Windows上编译C++代码时出错
- 我的字符计数代码计算错误.为什么
- 孤立代码块在结构中引发异常
- 在编译C++代码(具有dlib和opencv)到WASM时面临问题
- 为什么我的C#代码在调用回C++COM直到Task时会暂停.等待/线程.加入
- 处理小于cpu数据总线的数据类型.(c++转换为机器代码)
- 此代码是否违反一个定义规则
- 为什么我的代码在输出中增加了93天
- 我的简单if-else语句是如何无法访问的代码
- 使用动态分配的数组会导致代码分析发出虚假的C6386缓冲区溢出警告
- 为什么在这个代码结束循环中没有得到结束
- 在c代码之间共享数据的最佳方式
- 这个指针和内存代码打印是什么?我不知道是打印垃圾还是如何打印我需要的值