位集<10>和位集<2>(输入[i])的差异,需要解释

Difference in bitset<10> and bitset<2>(input[i]) , need explanation

本文关键字:gt lt 解释 输入 位集      更新时间:2023-10-16

我今天刚刚学会了一些简单的加密,并编写了一个简单的程序将我的文本转换为 10 位二进制文件。我不确定我是否正确,但代码的注释部分和实际代码有 2 个不同的 10 位输出。我很困惑。有人可以用通俗的语言向我解释吗?

#include <iostream>
#include <string>
#include <bitset>
#include "md5.h"
using namespace std;
using std::cout; 
using std::endl;
int main(int argc, char *argv[])
{
string input ="";
cout << "Please enter a string:n>";
getline(cin, input);
cout << "You entered: " << input << endl;
cout << "md5 of " << input << ": " << md5("input") << endl;
cout << "Binary is: ";
// cout << bitset<10>(input[1]);
for (int i=0; i<5; i++)
cout << bitset<2>(input[i]);
cout << endl;
return 0;
}

tl;dr :字符是 8 位,字符串运算符 [] 返回不同的字符,因此您访问了不同的字符并获取了其中的前两位。解决方案是将字符视为:8 位。通过做一些聪明的位操作,我们可以达到预期的效果。

问题所在

虽然我还没有完全理解你试图做什么,但我可以回答这段代码可能存在的问题:

通过调用

cout<<bitset<10>(input[1]);

您正在读取从第二个字符开始的 10 位(input[0]将从第一个字符开始)。

现在,循环执行完全不同的操作:

for (int i=0; i<5; i++)
cout << bitset<2>(input[i]);

它使用字符串的第 i 个字符,并从中构造一个位集。

位集构造函数的引用告诉我们,这意味着 char 被转换为无符号的长整型,然后转换为位集。

好的,让我们看看它如何处理一个简单的输入字符串,例如

std::string input = "aaaaa";

这个字符串的第一个字符是"a",它给你 8 位的 '01100001'(ASCII 表),因此从中构造的 10 位位集原来是打印的

0001100001

我们看到左侧位的清晰填充(更重要)。

另一方面,如果您通过循环浏览字符,则访问每个字符并且只获取其中的 2 位。

在我们的字符"a"="01100001"的情况下,这些位是"01"。因此,您的程序将输出01五次。

现在,修复它的方法是更多地考虑您实际访问的位。

可能的解决方案

在任何情况下,您想获取字符串的前十位吗?

在这种情况下,您需要编写以下内容:

std::bitset<10>(input[0]);
//Will pad the first two bits of the bitset as '0'

for(int i=0;i<5;++i){
char referenced = input[i/4];
std::bitset<2>((referenced>>(6-(i%4)*2)));
}

循环代码经过重新设计,可按顺序将整个字符串读取为 2 位位集。 因此,由于在一个字符中有 8 位,我们可以从单个字符中读取其中的 4 个集合 ->这就是"引用"的原因。

循环下部的位移使其从 6 的移位开始,然后是 4,然后是 2,然后是 0,然后重置为 6 的下一个字符,依此类推...... (这样,我们可以从每个 8 位字符中提取 2 个相关位)

这种类型的循环实际上将读取字符串的所有部分并执行正确的构造。

最后一句话

要直接从字符串构造位集,您必须使用原始内存(以位为单位),然后从中构造位集。 您可以从每个字符构造 8 位位集并将它们相互追加,或者从每个 8 位位集创建一个字符串,将它们连接起来,然后使用最后一个字符串 1 和 0 构造任意大小的大型位集。

我希望它有所帮助。