C++:字符串到字符数组的转换(删除了非 ASCII 字符)

C++ : String to Character Array conversion (non-Ascii characters removed)

本文关键字:字符 删除 ASCII 字符串 数组 C++ 转换      更新时间:2023-10-16

我有一个有效负载字符串,我想将其转换为字符数组,然后从中删除任何非 ASCII 字符。这是我的代码:

bool invalidChar (char c) 
{  
    return !(c>=0 && c <256);   
} 
void stripUnicode(string &str) 
{ 
    str.erase(remove_if(str.begin(),str.end(), invalidChar), str.end());  
}

Payload_input 是由 ASCII 和非 ASCII 字符组成的字符串:

 stripUnicode(Payload_input) ;
     char input[Payload_input.length()];
    strcpy(input,Payload_input.c_str());

    char chunk1[Payload_input.length()];
    int counter1=0;
for(counter1=0; counter1< size; counter1++)
{
        chunk1[counter1]=input[counter1];
}

现在,这是我想要转换为字符数组的字符串有效负载:

--90B452BFFF3F395ABDC878D8BEDBD152
Content-Disposition: form-data; name="uploaddir"
language/2BB5B9330E/C/
--90B452BFFF3F395ABDC878D8BEDBD152
Content-Disposition: form-data; name="filename"; filename="lottery[1]20110727082525.jpg"
Content-Type: text/plain
Content-Transfer-Encoding: binary
JFIFddDucky<http://ns.adobe.com/xap/1.0/<?xpacket begin="" id="W5M0MpCehiHzreSzNTczkc9d"?>

在上面的字符串中,Content-Transfer-Encoding: 二进制之后的几个字符出现在 linux 终端上的块中(在块内写为 0001 等)。

当我尝试在从字符串中删除非 ASCII 字符后打印字符(cout <<chunk1[counter1])时,甚至一些 ASCII 字符在内容传输编码:二进制行后也被省略。

如果我的代码有问题,请指出来?

问题是在

Linux 上char总是在 -128-127 范围内,所以你的 invalidChar 函数将为所有不是严格 ASCII 的字符返回true。如果你想检查扩展的ASCII(0-255),那么你的函数是无用的:每个char值都在扩展的ASCII集中;但是,由于char是签名的,因此您需要检查负值。