在Windows上使用c++将希伯来字符串放入变量中

Putting Hebrew string in a variable using C++ on Windows

本文关键字:字符串 变量 Windows c++      更新时间:2023-10-16

我有问题把希伯来字符串在这样的变量:

wchar_t* hebrewString = L"א";

的unicode值是十六进制的0x05d0或十二月制的1488

问题是我的记忆显示完全不连接的不同值到的实值。

如果我写:

wchar_t hebrewChar = 0x05d0 

很明显,正确的值将在hebrewChar中,但我想写常规字符串。

我想也许我做错了什么,所以我在生成ASM代码中查找,即使在那里它的值也是错误的。

我如何写希伯来字符串在一个简单的方式?


编辑1:

添加源代码(在注释上面的代码是程序集)

wchar_t d = 0x05D0;
// DB 0f3H, 05H, 090H, 00H, 00H, 00H
wchar_t *test = L"א";
// mov  eax, 1523               ; 000005f3H
wchar_t test1 = L'א';
// mov  eax, -112               ; ffffff90H
char test2 = 'א';

通过在字符串或Unicode字符前指定L,编译器将其转换为与所保存的编码文件相匹配的编码。因此,您必须通过 file -> Advance Save Options更改文件编码,例如选择带有签名- codepage 65001的UTF 8

还要记住,Windows控制台不能打印所有的Unicode字符(如果你有不同的默认语言和编码,你可以)。

这里还有一个例子,通过将字符保存到文本文件中来查看代码是否正常工作:

#include <iostream>
#include <fstream>
using namespace std;

int main()
{
    // UCS-2 little endian text file magic number
    char magic_number[] = { 0xFF, 0xFE };    
    wchar_t unicode_char = L'א';
    wchar_t unicode_val = 0x05d0;
    if (unicode_char == unicode_val)
        cout << "Works!" << endl;
    ofstream f("out.txt", ios::out);
    f.write(magic_number, 2);
    f.write((char *)&unicode_char, 2);
    f.close();
    return 0;
}

打开文件,检查输出值是否正确。否则,为了在代码中存储非ANSI字符,我强烈建议使用像ICU这样的库来保存、加载……-一般所有关于字符串的操作