关于共享库和libpthread.so的c++问题

g++ issues with shared libraries and libpthread.so

本文关键字:so libpthread c++ 问题 于共享 共享      更新时间:2023-10-16

我在这个问题上遇到了瓶颈,我希望我能在这里找到一些帮助。我已经创建了一个小的示例可执行和共享库,它显示了这个问题。

对不起,我意识到这已经变成了一堵文字墙,但我试图确保包括所有相关信息。

我设置

System: CentOS release 5.11 (Final)
g++: gcc version 4.4.7 20120313 (Red Hat 4.4.7-1) (GCC) 
libc.so.6: Compiled by GNU CC version 4.1.2 20080704 (Red Hat 4.1.2-55).

我也在Redhat 6.6机器上尝试过,结果类似。

我的场景:

我有一个应用程序,试图加载一个共享库在运行时通过::dlopen()。如果我不在pthread中链接,那么它似乎可以工作,但它最终会在共享库中崩溃,试图抛出异常。这样做的原因是,系统运行时库是期望线程本地存储(TLS)构建的,异常处理使用来自TLS的数据结构,但在这种情况下,它是NULL,这会导致崩溃。函数是__cxa_allocate_exception和__cxa_get_globals,看起来它们使用了libc中的存根函数,因为pthread没有链接进来。

我现在遇到的问题是试图在pthread中链接以纠正上述问题。如果我使用pthreads进行构建,应用程序在试图加载libpthread.so时就会出现分段错误。0作为共享库的依赖项。我所读到的关于这个崩溃的一切都是应用程序是在没有pthread的情况下构建的,而共享库是用pthread构建的。然而,我正在用pthreads构建两个二进制文件,我仍然遇到这个问题。

示例代码:

共享库文件(foo.*)

foo。

#pragma once
extern "C"
{
    extern void DoWork();
}

foo.cpp

#include "foo.h"
#include <stdio.h>
void DoWork()
{
    printf( "SharedLibrary::DoWork()n" );
}

应用程序文件(main.cpp)

main.cpp

#include "foo.h"
#include <stdio.h>
#include <dlfcn.h>
void LoadSharedLibrary()
{
    void* handle = 0;
    void(*function)();
    try
    {
        printf( "Loading the shared libraryn" );
        handle = ::dlopen( "libfoo.so", 2 );
        function = (void (*)())::dlsym( handle, "DoWork" );
        printf( "Done loading the shared libraryn" );
        function();
    }
    catch(...)
    {
        printf( "ERROR - Exception while trying to load the shared libraryn" );
    }
}
int main(int argc, char* argv[])
{
    LoadSharedLibrary();
    return 0;
}

显式加载

尝试在运行时使用以下构建脚本加载共享库会导致试图加载libpthread.so.0的段错误。

构建脚本:

compiler=g++
arch=-m32
echo gcc architecture flag: ${arch}
${compiler} -c -fPIC -g ${arch} -pthread -o ./foo.o foo.cpp
${compiler} ${arch} -shared -g -o ./libfoo.so ./foo.o -lpthread
${compiler} -c -fPIC -g ${arch} -pthread -o ./main.o main.cpp
${compiler} ${arch} -static -g -o main.out ./main.o -lpthread -ldl -lc 

这个崩溃的堆栈跟踪是:

#0  0x00000000 in ?? ()
#1  0x0089a70a in __pthread_initialize_minimal_internal () at init.c:417
#2  0x0089a218 in call_initialize_minimal () from /lib/libpthread.so.0
#3  0x00899da8 in _init () from /lib/libpthread.so.0
#4  0x0808909b in call_init ()
#5  0x080891b0 in _dl_init ()
#6  0x08063a87 in dl_open_worker ()
#7  0x0806245a in _dl_catch_error ()
#8  0x0806349e in _dl_open ()
#9  0x08053106 in dlopen_doit ()
#10 0x0806245a in _dl_catch_error ()
#11 0x08053541 in _dlerror_run ()
#12 0x08053075 in __dlopen ()
#13 0x0804830f in dlopen ()
#14 0x0804824f in LoadSharedLibrary () at main.cpp:13
#15 0x080482d3 in main (argc=1, argv=0xffffd3e4) at main.cpp:27

加载的共享库如下:

From        To          Syms Read   Shared Object Library
0xf7ffb3b0  0xf7ffb508  Yes         libfoo.so
0x0089a210  0x008a5bc4  Yes (*)     /lib/libpthread.so.0
0xf7f43670  0xf7fbec24  Yes (*)     /usr/lib/libstdc++.so.6
0x009a8410  0x009c35a4  Yes (*)     /lib/libm.so.6
0xf7efb660  0xf7f02f34  Yes (*)     /lib/libgcc_s.so.1
0x0074dcc0  0x0084caa0  Yes (*)     /lib/libc.so.6
0x007197f0  0x0072f12f  Yes (*)     /lib/ld-linux.so.2
(*): Shared library is missing debugging information.

隐式加载

这使用了一个不同的构建脚本,它试图在构建时设置依赖项,理论上不需要显式的加载调用。对于我们的现实世界场景来说,这不是一个有效的用例,但我在调查这个问题时试图这样做。

构建脚本:

compiler=g++
arch=-m32
echo gcc architecture flag: ${arch}
${compiler} -c -fPIC -g ${arch} -pthread -o ./foo.o foo.cpp
${compiler} ${arch} -shared -g -o ./libfoo.so ./foo.o -lpthread
${compiler} -c -fPIC -g ${arch} -pthread -o ./main.o main.cpp
${compiler} ${arch} -static -g -L. -o main.out ./main.o -lpthread -ldl -Wl,-Bdynamic -lfoo -Wl,-static -lc

行为:

Starting program: /app_local/dev3/stack_overflow/main.out 
/bin/bash: /app_local/dev3/stack_overflow/main.out: /usr/lib/libc.so.1: bad ELF interpreter: No such file or directory
/bin/bash: /app_local/dev3/stack_overflow/main.out: Success

启动过程中程序退出,代码为1。

奇怪的是,我已经完成了objdump -p <library> | grep NEEDED,而依赖链中没有一个库将libc.so.1作为依赖项。他们所依赖的libc版本是libc.so.6

构建场景结束

我真的希望这里有人知道发生了什么事,可以帮助我。我的Google和StackOverflow技能失败了,因为我发现的所有问题都指向不匹配的pthread使用是根本问题。

提前感谢!

${compiler} ${arch} -static -g -o main.out ./main.o -lpthread -ldl -lc

这是一个全静态链接。

在大多数操作系统上,不能从完全静态二进制文件调用dlopen (libdl.a中没有提供dlopen,因此链接失败)。

GLIBC是一个例外,但仅限于需要dlopen来支持/etc/nsswitch.conf。几乎可以肯定的是,不支持将libpthread.so.0动态加载到包含libpthread.a副本的全静态a.out中。简短的回答是:这很疼,不要那样做。

在任何现代UNIX系统上,

全静态链接通常都是一个非常糟糕的主意。多线程应用的全静态链接更是如此。完全静态链接,然后动态加载libpthread的另一个副本?真的坏主意。

更新:

GLIBC包含许多库(200多个),我强烈建议不要对任何这样的库混合使用静态和动态链接。换句话说,如果针对libc.a进行链接,则将其设置为完全静态的链接。如果您链接到libc.so,那么不要静态地链接libpthread.alibdl.a或GLIBC的任何其他部分。