对Strcat和Strlen功能的深刻理解

Deep understanding of strcat and strlen functions

本文关键字：功能 Strcat Strlen 更新时间：2023-10-16

我们知道strcat((将poiner作为参数接收到目标数组，并将它们与源字符串相连。目的地阵列应足够大以存储串联结果。最近，我发现，即使目标阵列不足以添加第二个字符串，strcat((仍然可以按预期执行，即使小程序也可以执行。我开始冲浪stackoverflow，发现夫妇 - 这个问题的答案。我想更深入地走，并了解在下面运行此代码时，硬件层中到底发生了什么？

#include<iostream>
#include<iomanip>
#include<cmath>
#include<cstring>
using namespace std;
int main(){
    char p[6] = "Hello";
    cout << "Length of p before = " << strlen(p) << endl;
    cout << "Size of p before = " << sizeof(p) << endl;
    char as[8] = "_World!";
    cout << "Length of as before = " << strlen(as) << endl;
    cout << "Size of as before = " << sizeof(as) << endl;
    cout << strcat(p,as) << endl;
    cout << "After concatenation:" << endl;
    cout << "Length of p after = " << strlen(p) << endl;
    cout << "Size of p after = " << sizeof(p) << endl; 
    cout << "Length of as after = " << strlen(as) << endl;
    cout << "Size of as after = " << sizeof(as) << endl;
    return 0;
}

运行此代码后，数组p []的长度为12，而p []的大小为6。如何将这种长度存储在此类数组大小上？我的意思是，对于此数组，字节的数量有限，这是否意味着strlen(p(函数仅查看null终结器，并且不断计数直到其发现并忽略该数组的实际分配大小。sizeof((函数并不真正在乎Array中的最后一个元素(故意分配给Null-Character(是否是存储null-Character。

阵列p分配在函数堆栈框架上，因此strcat"溢出"缓冲区p，并继续旋转到堆栈的其他区域 - 通常它覆盖其他本地参数，函数返回函数返回地址等(请记住，在X86平台功能堆栈通常会增长"向下"，即朝较小的地址增长(。这是著名的"缓冲区溢出"漏洞。

strlen不知道缓冲区的实际尺寸是多少，它只是寻找 0末端。另一方面，sizeof是一个编译时函数，可返回字节中的数组大小。

您在p的范围之外写作，因此程序的行为不确定。

虽然行为完全不确定，但发生了一些常见的行为：

您覆盖了一些无关的数据。这可能是其他本地变量，函数返回地址等。如果不检查编译器为该特定程序生成的组件，就不可能确切猜测什么将被覆盖的内容。这可能会导致严重的安全性漏洞，因为它可以允许攻击者将自己的代码注入程序的内存空间，并让他们覆盖函数的返回地址以使程序执行其注入的代码。
程序崩溃。如果您在数组的末端写得足够远以传递内存页面边界，则可能会发生这种情况。该程序可以尝试将OS尚未映射到应用程序的物理内存的虚拟内存地址。这导致操作系统杀死您的应用程序(例如，在Linux上使用SIGSEGV(。通常，这种动态分配的数组比功能 - 本地阵列更频繁地发生。