对Strcat和Strlen功能的深刻理解

Deep understanding of strcat and strlen functions

本文关键字:功能 Strcat Strlen      更新时间:2023-10-16

我们知道strcat((将poiner作为参数接收到目标数组,并将它们与源字符串相连。目的地阵列应足够大以存储串联结果。最近,我发现,即使目标阵列不足以添加第二个字符串,strcat((仍然可以按预期执行,即使小程序也可以执行。我开始冲浪stackoverflow,发现夫妇 - 这个问题的答案。我想更深入地走,并了解在下面运行此代码时,硬件层中到底发生了什么?

#include<iostream>
#include<iomanip>
#include<cmath>
#include<cstring>
using namespace std;
int main(){
    char p[6] = "Hello";
    cout << "Length of p before = " << strlen(p) << endl;
    cout << "Size of p before = " << sizeof(p) << endl;
    char as[8] = "_World!";
    cout << "Length of as before = " << strlen(as) << endl;
    cout << "Size of as before = " << sizeof(as) << endl;
    cout << strcat(p,as) << endl;
    cout << "After concatenation:" << endl;
    cout << "Length of p after = " << strlen(p) << endl;
    cout << "Size of p after = " << sizeof(p) << endl; 
    cout << "Length of as after = " << strlen(as) << endl;
    cout << "Size of as after = " << sizeof(as) << endl;
    return 0;
}

运行此代码后,数组p []的长度为12,而p []的大小为6。如何将这种长度存储在此类数组大小上?我的意思是,对于此数组,字节的数量有限,这是否意味着strlen(p(函数仅查看null终结器,并且不断计数直到其发现并忽略该数组的实际分配大小。sizeof((函数并不真正在乎Array中的最后一个元素(故意分配给Null-Character(是否是存储null-Character。

阵列p分配在函数堆栈框架上,因此strcat"溢出"缓冲区p,并继续旋转到堆栈的其他区域 - 通常它覆盖其他本地参数,函数返回函数返回地址等(请记住,在X86平台功能堆栈通常会增长"向下",即朝较小的地址增长(。这是著名的"缓冲区溢出"漏洞。

strlen不知道缓冲区的实际尺寸是多少,它只是寻找 0末端。另一方面,sizeof是一个编译时函数,可返回字节中的数组大小。

您在p的范围之外写作,因此程序的行为不确定。

虽然行为完全不确定,但发生了一些常见的行为:

  1. 您覆盖了一些无关的数据。这可能是其他本地变量,函数返回地址等。如果不检查编译器为该特定程序生成的组件,就不可能确切猜测什么将被覆盖的内容。这可能会导致严重的安全性漏洞,因为它可以允许攻击者将自己的代码注入程序的内存空间,并让他们覆盖函数的返回地址以使程序执行其注入的代码。

  2. 程序崩溃。如果您在数组的末端写得足够远以传递内存页面边界,则可能会发生这种情况。该程序可以尝试将OS尚未映射到应用程序的物理内存的虚拟内存地址。这导致操作系统杀死您的应用程序(例如,在Linux上使用SIGSEGV(。通常,这种动态分配的数组比功能 - 本地阵列更频繁地发生。