位集<10>和位集<2>(输入[i])的差异，需要解释

Difference in bitset<10> and bitset<2>(input[i]) , need explanation

本文关键字：gt lt 解释输入位集更新时间：2023-10-16

我今天刚刚学会了一些简单的加密，并编写了一个简单的程序将我的文本转换为 10 位二进制文件。我不确定我是否正确，但代码的注释部分和实际代码有 2 个不同的 10 位输出。我很困惑。有人可以用通俗的语言向我解释吗？

#include <iostream>
#include <string>
#include <bitset>
#include "md5.h"
using namespace std;
using std::cout; 
using std::endl;
int main(int argc, char *argv[])
{
string input ="";
cout << "Please enter a string:n>";
getline(cin, input);
cout << "You entered: " << input << endl;
cout << "md5 of " << input << ": " << md5("input") << endl;
cout << "Binary is: ";
// cout << bitset<10>(input[1]);
for (int i=0; i<5; i++)
cout << bitset<2>(input[i]);
cout << endl;
return 0;
}

tl;dr ：字符是 8 位，字符串运算符 [] 返回不同的字符，因此您访问了不同的字符并获取了其中的前两位。解决方案是将字符视为：8 位。通过做一些聪明的位操作，我们可以达到预期的效果。

问题所在

虽然我还没有完全理解你试图做什么，但我可以回答这段代码可能存在的问题：

通过调用

cout<<bitset<10>(input[1]);

您正在读取从第二个字符开始的 10 位(input[0]将从第一个字符开始)。

现在，循环执行完全不同的操作：

for (int i=0; i<5; i++)
cout << bitset<2>(input[i]);

它使用字符串的第 i 个字符，并从中构造一个位集。

位集构造函数的引用告诉我们，这意味着 char 被转换为无符号的长整型，然后转换为位集。

好的，让我们看看它如何处理一个简单的输入字符串，例如

std::string input = "aaaaa";

这个字符串的第一个字符是"a"，它给你 8 位的 '01100001'(ASCII 表)，因此从中构造的 10 位位集原来是打印的

0001100001

我们看到左侧位的清晰填充(更重要)。

另一方面，如果您通过循环浏览字符，则访问每个字符并且只获取其中的 2 位。

在我们的字符"a"="01100001"的情况下，这些位是"01"。因此，您的程序将输出01五次。

现在，修复它的方法是更多地考虑您实际访问的位。

可能的解决方案

在任何情况下，您想获取字符串的前十位吗？

在这种情况下，您需要编写以下内容：

std::bitset<10>(input[0]);
//Will pad the first two bits of the bitset as '0'

或

for(int i=0;i<5;++i){
char referenced = input[i/4];
std::bitset<2>((referenced>>(6-(i%4)*2)));
}

循环代码经过重新设计，可按顺序将整个字符串读取为 2 位位集。因此，由于在一个字符中有 8 位，我们可以从单个字符中读取其中的 4 个集合 ->这就是"引用"的原因。

循环下部的位移使其从 6 的移位开始，然后是 4，然后是 2，然后是 0，然后重置为 6 的下一个字符，依此类推...... (这样，我们可以从每个 8 位字符中提取 2 个相关位)

这种类型的循环实际上将读取字符串的所有部分并执行正确的构造。

最后一句话

要直接从字符串构造位集，您必须使用原始内存(以位为单位)，然后从中构造位集。您可以从每个字符构造 8 位位集并将它们相互追加，或者从每个 8 位位集创建一个字符串，将它们连接起来，然后使用最后一个字符串 1 和 0 构造任意大小的大型位集。

我希望它有所帮助。