URL 编码扩展的 ASCII 标准::字符串在 C++.

URL Encoding an Extended ASCII std::string in C++

本文关键字:字符串 C++ 标准 ASCII 编码 扩展 URL      更新时间:2023-10-16

我有一个充满扩展 ASCII 值的std::string(例如 čáě (。我需要对这个字符串进行 URL 编码,以便 JavaScript 使用 DecodeURIComponent 进行解码。

我尝试通过windows-1252代码点将其转换为 UTF-16,然后转换为 UTF-8,但由于没有足够的示例用于MultiByteToWideCharWideCharToMultiByte函数而无法这样做。

我正在Windows 14.0 64位上使用MSVC-10进行编译。

如何至少迭代最终 UTF-8 字符串的各个字节以进行 URL 编码?

谢谢

您可以使用

MultiByteToWideChar将字符串转换为 UTF-16,然后逐个对字符进行编码。

示例代码:

std::string readData = "Extended ASCII characters (ěščřžýáíé)";
int size = MultiByteToWideChar(
    1252, //1252 corresponds with windows-1252 codepoint
    0,
    readData.c_str(),
    -1, //the string is null terminated, no need to pass the length
    NULL,
    0
);
wchar_t* wchar_cstr = new wchar_t[size];
MultiByteToWideChar(
    1252,
    0,
    readData.c_str(),
    -1,
    wchar_cstr,
    size
);
std::stringstream encodeStream;
for(uint32_t i = 0; i < size; i++){
    wchar_t wchar = wchar_cstr[i];
    uint16_t val = (uint16_t) wchar;
    encodeStream << "%" << std::setfill('0') << std::setw(2) << std::hex << val;
}
delete[] wchar_cstr;
std::string encodedString = encodeStream.str(); // the URL encoded string

虽然这确实编码了基本的ASCII字符(<128(,但它完全可以通过JavaScript解码,这是最终目标。

我设法用非常简单的代码做到了这一点。下面是将从文件读取的 JSON 转换为 URL 并发送到外部网站以显示 JSON 中的语法错误的示例(在 MS/Windows 上测试(:

void EncodeJsonFileTextAndSendToExternalWebSiteToShowSyntaxErrors (const std::string &jsonTxt)
{
        std::stringstream encodeStream;
        for (char c : jsonTxt)
        {
            if (c>='0' && c<='9' || c>='a' && c<='z' || c>='A' && c<='Z' || strchr("{}();",c))
                encodeStream << c;
            else
                encodeStream << "%" << std::setfill('0') << std::setw(2) << std::hex << (int)c;
        }
        std::string url = "cmd /c start https://jsonlint.com/?json=" + encodeStream.str();
        system(url.c_str());
}

它会自动打开这样的 Web 浏览器:https://jsonlint.com/?json={%0a%22dataset%20name%22%3a%20%22CIHP%22%0alabel%2017%0a}