以编程方式获取共享库中的函数名

Get functions names in a shared library programmatically

本文关键字:函数 共享 编程 方式 获取      更新时间:2023-10-16

当我使用dl_open()时,我可以从共享库(仅限Linux)以编程方式获得所有函数名称的列表吗?

我想要这样的东西:

std::vector<std::string> list_all_functions(void *dl) { 
   //... what can I do here?
}
int main() {
    void * dl = dl_open("./mylib.so", RTLD_NOW);
    auto functions = list_all_functions(dl);
    //...
    dl_close(dl);
    return 0;
}

示例库(mylib.so)

头文件(. h):

extern "C" {
    int sum (int a, int b);
}
源(c):

int sum (int a, int b) { return a + b; }

我知道的肮脏hack:使用nmobjdump utility

更新| TL;博士:

我实际上找到了更短的方法:

    auto library = dlopen("/path/to/lib.so", RTLD_LAZY | RTLD_GLOBAL);
    const char * libname = "lib.so";
    struct link_map * map = nullptr;
    dlinfo(library, RTLD_DI_LINKMAP, &map);
    Elf64_Sym * symtab = nullptr;
    char * strtab = nullptr;
    int symentries = 0;
    for (auto section = map->l_ld; section->d_tag != DT_NULL; ++section)
    {
        if (section->d_tag == DT_SYMTAB)
        {
            symtab = (Elf64_Sym *)section->d_un.d_ptr;
        }
        if (section->d_tag == DT_STRTAB)
        {
            strtab = (char*)section->d_un.d_ptr;
        }
        if (section->d_tag == DT_SYMENT)
        {
            symentries = section->d_un.d_val;
        }
    }
    int size = strtab - (char *)symtab;
    for (int k = 0; k < size / symentries; ++k)
    {
        auto sym = &symtab[k];
        // If sym is function
        if (ELF64_ST_TYPE(symtab[k].st_info) == STT_FUNC)
        {
            //str is name of each symbol
            auto str = &strtab[sym->st_name];
            printf("%sn", str);
        }
    }

我相信作者不再需要这个了,但也许有人需要实际的代码,这里是(基于之前的答案)

首先,我们需要dl_iterate_phdr()的回调:

static int callback(struct dl_phdr_info *info, size_t size, void *data)
{
    // data is copy of 2nd arg in dl_iterate_phdr
    // you can use it for your lib name as I did
    const char * libname = (const char *)data;
    // if current elf's name contains your lib
    if (strstr(info->dlpi_name, libname))
    {
        printf("loaded %s from: %sn", libname, info->dlpi_name);
        for (int j = 0; j < info->dlpi_phnum; j++)
        {
            // we need to save dyanmic section since it contains symbolic table
            if (info->dlpi_phdr[j].p_type == PT_DYNAMIC)
            {
                Elf64_Sym * symtab = nullptr;
                char * strtab = nullptr;
                int symentries = 0;
                auto dyn = (Elf64_Dyn *)(info->dlpi_addr + info->dlpi_phdr[j].p_vaddr);
                for (int k = 0; k < info->dlpi_phdr[j].p_memsz / sizeof(Elf64_Dyn); ++k)
                {
                    if (dyn[k].d_tag == DT_SYMTAB)
                    {
                        symtab = (Elf64_Sym *)dyn[k].d_un.d_ptr;
                    }
                    if (dyn[k].d_tag == DT_STRTAB)
                    {
                        strtab = (char*)dyn[k].d_un.d_ptr;
                    }
                    if (dyn[k].d_tag == DT_SYMENT)
                    {
                        symentries = dyn[k].d_un.d_val;
                    }
                }
                int size = strtab - (char *)symtab;
                // for each string in table
                for (int k = 0; k < size / symentries; ++k)
                {
                    auto sym = &symtab[k];
                    auto str = &strtab[sym->st_name];
                    printf("%sn", str);
                }
                break;
            }
        }
    }
    return 0;
}

接下来,我们调用dl_iterate_phdr():

int main()
{
    auto library = dlopen("/path/to/library.so", RTLD_LAZY | RTLD_GLOBAL);
    const char * libname = "library.so";
    dl_iterate_phdr(callback, (void*)libname);
    return 0;
}

如果您需要将这些名称存储在某个地方,您可以将指针传递给容器,使用强制转换恢复它并在那里写入。

对于我的示例库:

#include "simple_lib.h"
#include <cstdio>
void __attribute__ ((constructor)) initLibrary(void)
{
    printf("Library is initializedn");
}
void __attribute__ ((destructor)) cleanUpLibrary(void)
{
    printf("Library is exitedn");
}
void make_number()
{
    printf("1n");
}

打印:

Library is initialized
_ITM_deregisterTMCloneTable
puts
__gmon_start__
_ITM_registerTMCloneTable
__cxa_finalize
_Z11initLibraryv
make_number
_Z14cleanUpLibraryv
Library is exited

没有libc函数可以这样做。但是,您可以自己编写一个(或者从readelf之类的工具复制/粘贴代码)。

在Linux上,dlopen()返回link_map结构体的地址,该结构体有一个名为l_addr的成员,该成员指向加载的共享对象的基址(假设您的系统没有随机分配共享库的位置,并且您的库没有预链接)。

在Linux上,找到基址(Elf*_Ehdr的地址)的一种方法是在dlopen()之后使用dl_iterate_phdr()

有了ELF头,您应该能够遍历导出的符号列表(动态符号表),首先定位PT_DYNAMIC类型的Elf*_Phdr,然后定位DT_SYMTABDT_STRTAB项,然后遍历动态符号表中的所有符号。使用/usr/include/elf.h来指导你。

另外,你可以用libelf,我个人不太了解。

但是,请注意,您将得到一个定义函数列表,但您不知道如何调用它们。