当字符串包含 %2C 时,在 c++ 中不完整的 std::string

Incomplete std::string in c++ when the string contains %2C

本文关键字:std string c++ 包含 字符串 %2C      更新时间:2023-10-16

直接看我的回答,忽略下面的文字...

我正在尝试使用 openssl CLI 通过 C++ 读取 x509 证书。(是的,我知道OpenSSL也有一个C API,但这对我的问题并不重要(。OpenSSL版本是1.1.0g,gcc编译器是7.4.0

所以,我想openssl x509 -noout -text -in certFile.cer执行命令并获取输出。

我尝试使用三种不同的C++解决方案:

  • popen(),以检索输出
  • system(),在命令末尾添加> temp.txt以重定向输出,然后从中读取
  • system(),使用命令openssl x509 -noout -text -in certFile.cer -out tempFile这样我就不需要重定向输出,而是将输出写入文件。然后,我阅读了文件。

这是我正在使用的一段代码(如您所见,我还尝试添加stdbuf -o 0以避免缓冲(

string execCommandAndGetOutput_withPopen(const char* cmd, int* result)
{
std::array<char, 1024> buffer;
std::string output;
string cmd_unbuf;
cmd_unbuf.append("stdbuf -o 0 ");
cmd_unbuf.append(cmd);
cmd_unbuf.append(" 2>&1");
FILE* pipe = popen(cmd_unbuf.c_str(), "r");
if (!pipe) {
throw std::runtime_error("popen() failed!");
}
while (fgets(buffer.data(), buffer.size(), pipe) != nullptr) {
output += buffer.data();
}
*result = pclose(pipe);
return output;
}
string execCommandAndGetOutput_withSystem(const char* cmd, int* result)
{
std::string output;
string cmd_unbuf;
cmd_unbuf.append("stdbuf -o 0 ");
cmd_unbuf.append(cmd);
cmd_unbuf.append(" > /tmp/temp 2>&1");
int  cmdResult = system(cmd_unbuf.c_str());
std::ifstream file("/tmp/temp");
std::string fileContent((std::istreambuf_iterator<char>(file)), std::istreambuf_iterator<char>());
remove("/tmp/temp");
*result = cmdResult;
return fileContent;
}

使用第二个函数时,我试图不删除临时文件,并检查其内容,并且内容已完成。所以在system()通话中这不是问题。

在所有情况下,我得到的字符串都不完整。特别是它总是在同一点停止,特别是在 URL 的中间,就在%2CO.但是AFAIK,这应该不是问题,%2应该只是一个昏迷,html编码。

我试图检查字符串大小,我得到的字符串的大小4262,应该远离其最大值。

我还在两台机器上尝试了它:我遇到问题的第一台机器是我所有程序都已安装的机器,以及我得到错误的地方。在第二台机器中,我的开发机器,我只是在开发时运行一些测试,我从来没有注意到这个问题,使用相同的输入。请注意,两台机器都是 Ubuntu 服务器 18.04.3。

所以我的想法是:

  • %2是一个奇怪的角色,但似乎不是
  • string太大了,但似乎不是
  • 机器不同...是的,可能是某些包不同,但C++库应该是相同的......我不是 100% 确定,但据我检查,它们是......

我没主意了...有人有什么建议吗?要检查一些特定的 C 库?其他想法?

编辑:

即使我不会发布受影响的证书,我也可以发布受影响的行。这是完整的行:

URI:ldap://directory.swisssign.net/CN=DA32F949F851CC9871660CD9CEB6DB923F094BEF%2CO=SwissSign%2CC=CH?certificateRevocationList?base?objectClass=cRLDistributionPoint

但我只得到:

URI:ldap://directory.swisssign.net/CN=DA32F949F851CC9871660CD9CEB6DB923F094BEF

我还尝试在命令中添加| grep -A 10 'X509v3 CRL Distribution Points:'(以便我可以排除问题是字符串的长度(,并且输出相同,字符串被截断。所以问题似乎与角色%2C有关。

知道吗?

编辑 2:

更改主题

编辑3:

我正在调试一个错误,这就是我打印字符串的原因......不幸的是,我用syslog()打印它...我想2%C被解释为format

如果字符串中的%2C出现问题,请确保您没有使用某些使用format的函数,例如printfsyslog

就我而言,当我调试错误时,我正在使用syslog打印包含"%2C"的字符串,这造成了混乱......