如何链接两个LLVM位码模块?

How to link two LLVM bitcode modules?

本文关键字:LLVM 模块 两个 何链接 链接      更新时间:2023-10-16

我有一个简单的LLVM传递,可以重命名当前翻译单元中定义的每个函数(即:在所有预处理步骤发生后,有问题的源文件 - 见这里(。我的通行证如下:

#include <vector>
#include <iostream>
#include <fstream>
#include <string>
#include <sstream>
#include "llvm/Pass.h"
#include "llvm/IR/Function.h"
#include "llvm/Support/raw_ostream.h"
#include "llvm/ADT/STLExtras.h"
#include "llvm/ADT/SmallString.h"
#include "llvm/IR/DerivedTypes.h"
#include "llvm/IR/Module.h"
#include "llvm/IR/Type.h"
#include "llvm/IR/TypeFinder.h"
#include "llvm/Transforms/IPO.h"
#include "llvm/IR/Argument.h"
#include "llvm/IR/GlobalValue.h"
using namespace llvm;
namespace {
struct FunctionRename : public ModulePass {
static char ID; // Pass identification
FunctionRename() : ModulePass(ID) {}
bool runOnModule(Module &M) override {
// Rename all functions
for (auto &F : M) {
StringRef Name = F.getName();
// Leave library functions alone because their presence or absence
// could affect the behaviour of other passes.
if (F.isDeclaration())
continue;
F.setLinkage(GlobalValue::LinkOnceAnyLinkage);
F.setName(Name + "_renamed");
}
return true;
}
};
}
char FunctionRename::ID = 0;
static RegisterPass<FunctionRename> X("functionrename", "Function Rename Pass");
// ===-------------------------------------------------------==//
//
// Function Renamer - Renames all functions
//

在运行对位码文件进行传递后,file.bc,我将结果输出到一个新的文件file_renamed.bc,如下所示

opt -load /path/to/libFunctionRenamePass.so -functionrename < file.bc > file_renamed.bc

然后,我尝试链接这两个文件,如下所示

llvm-link file.bc file_renamed.bc -o file_linked.bc

但是,对于涉及构造函数和析构函数C++源文件(从中生成初始位码文件(,我仍然会遇到符号冲突。我的期望是这条线

F.setLinkage(GlobalValue::LinkOnceAnyLinkage)

将防止在file.bcfile_renamed.bc中定义的任何符号发生符号冲突。

我做错了什么?

当我尝试在示例位码文件上运行您的代码时,由于全局变量,llvm-link 步骤失败:

ERROR: Linking globals named 'my_global': symbol multiply defined!

在向 RunOnModule 例程添加第二个循环以处理全局变量后,llvm-link 成功,然后代码最终链接。

for (auto git = M.global_begin(), get = M.global_end(); git != get; ++git)
{
GlobalValue* gv = &*git;
gv->setLinkage(GlobalValue::LinkOnceAnyLinkage);
}

但是,我使用构造函数对C++代码的简单测试在有和没有此更改的情况下都有效。

我的完整解决方案如下:

#include <vector>
#include <iostream>
#include <fstream>
#include <string>
#include <sstream>
#include "llvm/Pass.h"
#include "llvm/IR/Function.h"
#include "llvm/Support/raw_ostream.h"
#include "llvm/ADT/STLExtras.h"
#include "llvm/ADT/SmallString.h"
#include "llvm/IR/DerivedTypes.h"
#include "llvm/IR/Module.h"
#include "llvm/IR/Type.h"
#include "llvm/IR/TypeFinder.h"
#include "llvm/Transforms/IPO.h"
#include "llvm/IR/Argument.h"
#include "llvm/IR/GlobalValue.h"
#include "llvm/IR/Metadata.h"
using namespace llvm;
namespace {
struct FunctionRename : public ModulePass {
static char ID; // Pass identification
FunctionRename() : ModulePass(ID) {}
bool runOnModule(Module &M) override {
for (auto it = M.global_begin(); it != M.global_end(); ++it)
{
GlobalVariable& gv = *it;
if (!gv.isDeclaration())
gv.setLinkage(GlobalValue::LinkerPrivateLinkage);
}
for (auto it = M.alias_begin(); it != M.alias_end(); ++it)
{
GlobalAlias& ga = *it;
if (!ga.isDeclaration())
ga.setLinkage(GlobalValue::LinkerPrivateLinkage);
}
// Rename all functions
for (auto &F : M) {
StringRef Name = F.getName();
// Leave library functions alone because their presence or absence
// could affect the behaviour of other passes.
if (F.isDeclaration())
continue;
F.setLinkage(GlobalValue::WeakAnyLinkage);
F.setName(Name + "_renamed");
}
return true;
}
};
}
char FunctionRename::ID = 0;
static RegisterPass<FunctionRename> X("functionrename", "Function Rename Pass");
// ===-------------------------------------------------------==//
//
// Function Renamer - Renames all functions
//

在循环中处理函数,for(auto &F : M) { ... },出于以下原因,我更喜欢使用WeakAnyLinkage而不是LinkOnceAnyLinkage

当发生链接时,具有LinkOnceAnyLinkage的全局变量(顾名思义(将与同名的其他符号合并,并且允许丢弃具有此链接的未引用全局变量。

具有WeakAnyLinkage的全局变量与LinkOnceAnyLinkage共享相同的全局变量,除了带有WeakAnyLinkage的未引用全局变量不能被丢弃。

此外,在处理全局变量和别名的两个循环中,我使用LinkerPrivateLinkage,因为我不希望此模块之外的任何对象都可以访问file_renamed.bc中的全局变量。

此外,处理别名的循环是必要的(至少在我的环境中(,以避免与完整对象构造函数和析构函数(即:根据 Itanium C++ ABI 的 C1 和 D1 析构函数(相关的符号冲突。