为什么 C++ Hello World 二进制文件比等效的 C 二进制文件大

Why is a C++ Hello World binary larger than the equivalent C binary?

本文关键字:二进制文件 C++ Hello World 为什么      更新时间:2023-10-16

Bjarne Stroustrup在他的FAQ中说,当使用gcc -O2编译时,使用C和C++的hello world的文件大小是相同的。

参考: http://www.stroustrup.com/bs_faq.html#Hello-world

我决定试试这个,这是C版本:

#include <stdio.h>
int main(int argc, char* argv[])
{
    printf("Hello world!n");
    return 0;
}

这是C++版本

#include <iostream>
int main(int argc, char* argv[])
{
    std::cout << "Hello world!n"; 
    return 0;
}

在这里我编译,大小不同:

r00t@wutdo:~/hello$ ls
hello.c  hello.cpp
r00t@wutdo:~/hello$ gcc -O2 hello.c -o c.out
r00t@wutdo:~/hello$ g++ -O2 hello.cpp -o cpp.out
r00t@wutdo:~/hello$ ls -l
total 32
-rwxr-xr-x 1 r00t r00t 8559 Sep  1 18:00 c.out
-rwxr-xr-x 1 r00t r00t 8938 Sep  1 18:01 cpp.out
-rw-r--r-- 1 r00t r00t   95 Sep  1 17:59 hello.c
-rw-r--r-- 1 r00t r00t  117 Sep  1 17:59 hello.cpp
r00t@wutdo:~/hello$ size c.out cpp.out
   text    data     bss     dec     hex filename
   1191     560       8    1759     6df c.out
   1865     608     280    2753     ac1 cpp.out

我用n替换了std::endl,它使二进制文件更小。我认为这么简单的东西会被内联,但很失望它不是。

另外哇,优化的组件有数百行组件输出? 我可以使用 5 条汇编指令编写 hello world sys_write,所有额外的东西是怎么回事? 为什么 C 在堆栈上放了一些额外的东西来设置? 我的意思是,就像 50 字节的汇编与 8kb 的 C 一样,为什么?

您正在查看容易被误解的信息组合。8559 和 8938 字节文件大小在很大程度上毫无意义,因为它们大多是带有符号名称和其他杂项信息的标头,至少用于最小的调试目的。稍微有意义的数字是您稍后添加的size(1)输出:

r00t@wutdo:~/hello$ size c.out cpp.out
   text    data     bss     dec     hex filename
   1191     560       8    1759     6df c.out
   1865     608     280    2753     ac1 cpp.out

您可以使用-A选项来获得更详细的细分 size ,但简而言之,这里的差异相当微不足道。

更有趣的是,Bjarne Stroustrup从未提到他是在谈论静态链接还是动态链接。在您的情况下,两个程序都是动态链接的,因此大小差异与 stdio 或 iostream 的实际大小成本无关;您只是在衡量调用代码的成本,或者(更有可能,基于其他注释/答案(对C++的异常处理支持的基本开销。现在,有一个普遍的说法,即基于iostream的静态链接C++hello world甚至比基于printf的hello world更小,因为编译器可以准确地看到使用了哪些重载版本的operator<<并优化出不需要的代码(例如昂贵的浮点打印(,而printf对格式字符串的使用使得这在普通情况下很困难,而且通常是不可能的。但是,我从未见过一个C++实现,其中基于静态链接的iostream的hello程序可以接近于C中基于printf的程序一样小,甚至小得多。

我认为

他将半千字节视为舍入误差。两者都是"9 KB",这就是您将在典型文件浏览器中看到的内容。它们并不完全相同,因为在引擎盖下,C 和 C++ 库完全不同。如果您已经熟悉反汇编器,则可以亲自查看差异的详细信息。

"额外的东西"是为了从标准库 shlib 导入符号,并处理C++异常。奇怪的是,GCC 编译的大部分 C 可执行文件都被C++异常处理表占用。我还没有弄清楚如何使用 GCC 剥离它们。

endl内联的,但它包含打印n字符和刷新流的调用,这些调用不是内联的。大小的差异是由于从标准库中导入它们。

事实上,单个千字节在任何具有动态加载库的系统上都无关紧要。自包含代码(例如在嵌入式系统上(需要包含其使用的标准库功能,并且C++标准库往往比其 C 对应库重 - <iostream> vs. 特别是<stdio.h>