Background
8145 words
41 minutes
如何编写Pass——从LLVM源码角度剖析
CAUTION

  本文内容基于 LLVM 15.0.7\text{LLVM 15.0.7} 版本,部分内容在其他版本中可能有所不同,请注意差异。

LLVM\text{LLVM}Pass\text{Pass}#

  LLVM\text{LLVM} 并非一个具体的编译器,而是一套可复用可组合编译器基础设施。其设计核心是将编译过程拆解为以中间表示LLVM IR\text{LLVM IR})为载体的不同阶段:前端负责将不同源码翻译为统一的 IR\text{IR}中端围绕 IR\text{IR} 进行分析与优化,而后端则再将优化后的 IR\text{IR} 映射到具体的硬件架构。这里不过多介绍中间表示 IR\text{IR},而是聚焦于承载实现分析与优化目的的LLVM Pass\text{LLVM Pass}

\text{LLVM} 架构图

  在 LLVM\text{LLVM} 中,所有对 IR\text{IR} 的 “计算” 都被统一抽象为 Pass\text{Pass}(在编译原理里,"Pass\text{Pass}" 被称为 “遍” 或者 “趟”,表示对代码做一次扫描)。Pass\text{Pass}LLVM\text{LLVM} 执行分析和优化的基本单位,其运行在某一层级的 IR\text{IR} 上,对程序进行分析或者修改。Pass\text{Pass} 分为分析类 Pass\text{Pass}转换类 Pass\text{Pass}

Pass={分析类 Pass:只读取转换类 Pass:可修改\text{Pass} = \begin{cases} \text{分析类 Pass}: \text{只读取} \\ \text{转换类 Pass}: \text{可修改} \end{cases}

前者只读取 IR\text{IR} 用于构建特定的分析结果,而后者则基于分析结果的基础上修改 IR\text{IR},实现各种变换。无论是经典的编译优化,还是用户自定义的程序分析,本质上都是以 Pass\text{Pass} 的形式存在。

IMPORTANT

  Pass\text{Pass}LLVM\text{LLVM} 中扮演的角色不仅是”实现优化”,更是整个中端架构的核心。

Pass\text{Pass} 分类与类设计#

  前面提到,Pass\text{Pass} 分为分析类Analysis Pass\text{Analysis Pass})和转换类Transformation Pass\text{Transformation Pass})两类。实际上,按粒度不同,Pass\text{Pass} 还可以进一步划分为模块级ModulePass\text{ModulePass})、函数级FunctionPass\text{FunctionPass})、循环级LoopPass\text{LoopPass})等不同层级的 Pass\text{Pass}

  LLVM 15.0.7\text{LLVM 15.0.7} 基于 NPM\text{NPM}New Pass Manager\text{New Pass Manager})的全新 Pass\text{Pass} 框架,一个核心的修改是通过 CRTP\text{CRTP} 静态多态替换了旧版 Pass Manager\text{Pass Manager} 中基于虚函数的动态多态设计。不妨来看一下 NPM\text{NPM} 中的 Pass\text{Pass} 类设计:

// $LLVM_HOME/include/llvm/IR/PassManager.h
template <typename DerivedT> struct PassInfoMixin {
/// Gets the name of the pass we are mixed into.
static StringRef name() {
static_assert(std::is_base_of<PassInfoMixin, DerivedT>::value,
"Must pass the derived type as the template argument!");
StringRef Name = getTypeName<DerivedT>();
Name.consume_front("llvm::");
return Name;
}
void printPipeline(raw_ostream &OS,
function_ref<StringRef(StringRef)> MapClassName2PassName) {
StringRef ClassName = DerivedT::name();
auto PassName = MapClassName2PassName(ClassName);
OS << PassName;
}
};

  PassInfoMixin\text{PassInfoMixin} 显然是一个模板混入类,通过 CRTP\text{CRTP} 方式为派生类提供了两个通用的方法(基于 “反射” 实现):name()\text{name()} 用于获取 Pass\text{Pass} 的名称,printPipeline()\text{printPipeline()} 用于打印 Pass\text{Pass} 管道信息。PassInfoMixin\text{PassInfoMixin} 是最顶层的 Pass\text{Pass} 模板基类,所有具体的 Pass\text{Pass} 都会直接或间接地继承自它。

TIP

  可能你会疑惑,作为 CRTP\text{CRTP} 模板基类的 PassInfoMixin\text{PassInfoMixin} 并没有直接调用派生类 DerivedT\text{DerivedT} 的任何方法,和 CRTP\text{CRTP} 中用法有所差异。实际上,CRTP\text{CRTP} 的核心思想是通过模板参数将派生类类型传递给基类,让基类知道派生类的类型信息,从而实现静态多态,这里实际上也是如此。

  分析类 Pass\text{Pass} 和转换类 Pass\text{Pass} 的区别体现在它们各自的模板基类上,分析类 Pass\text{Pass} 继承自 AnalysisInfoMixin\text{AnalysisInfoMixin},而转换类 Pass\text{Pass} 则继承自 PassInfoMixin\text{PassInfoMixin},而 AnalysisInfoMixin\text{AnalysisInfoMixin} 则是继承自 PassInfoMixin\text{PassInfoMixin}

// $LLVM_HOME/include/llvm/IR/PassManager.h
template <typename DerivedT>
struct AnalysisInfoMixin : PassInfoMixin<DerivedT> {
static AnalysisKey *ID() {
static_assert(std::is_base_of<AnalysisInfoMixin, DerivedT>::value,
"Must pass the derived type as the template argument!");
return &DerivedT::Key;
}
};

  AnalysisInfoMixin\text{AnalysisInfoMixin} 继承自 PassInfoMixin\text{PassInfoMixin},同样是一个模板混入类,专用于分析类 Pass\text{Pass}。它为分析类 Pass\text{Pass} 提供了一个静态方法 ID()\text{ID()} 用于获取分析类 Pass\text{Pass} 的唯一标识符 AnalysisKey\text{AnalysisKey}(此 Key\text{Key} 的实现也很有意思)。从这里我们也可以看出,继承自 AnalysisInfoMixin\text{AnalysisInfoMixin} 的分析类 Pass\text{Pass} 需定义一个静态成员变量 AnalysisKey\text{AnalysisKey} 作为其唯一的标识符。

类继承图

PassManager\text{PassManager}AnalysisManager\text{AnalysisManager}#

  到目前为止,我们的 Pass\text{Pass} 还只是一个空壳,除了明确分析类 Pass\text{Pass} 需提供静态成员变量 AnalysisKey\text{AnalysisKey} 用于标识外,并没有任何实质性的功能。要让 Pass\text{Pass} 真正发挥作用,还需要依赖 PassManager\text{PassManager}AnalysisManager\text{AnalysisManager} 来调度和管理 Pass\text{Pass} 的执行。

TIP

  虽然还没有介绍 Pass\text{Pass}run\text{run} 方法,但应该有一个概念:Pass\text{Pass} 本身就是一个 “无状态” 的执行单元,既不保存分析结果,也不负责调度,这些职责都交给了 PassManager\text{PassManager}AnalysisManager\text{AnalysisManager}

PassManager\text{PassManager}Pass\text{Pass} 的调度与执行#

  很容易犯错的一个误区是将 PassManager\text{PassManager} 理解为转换类 Pass\text{Pass} 的管理器,而将 AnalysisManager\text{AnalysisManager} 理解为分析类 Pass\text{Pass} 的管理器,两者负责各自 Pass\text{Pass} 的调度执行与管理。实际上,PassManager\text{PassManager} 才是 Pass\text{Pass} 的真正调度者,无论是分析类 Pass\text{Pass} 还是转换类 Pass\text{Pass},它们的执行都是由 PassManager\text{PassManager} 来负责的。

  NPM\text{NPM} 中,分析类 Pass\text{Pass} 采用所谓的 “按需计算” 策略执行,即只有在某个转换类 Pass\text{Pass} 需要某个分析类 Pass\text{Pass} 的结果时,才会触发该分析类 Pass\text{Pass} 的执行。因此,在 NPMNPM 中,对分析类 Pass\text{Pass} 的调用,需要通过转换类 Pass\text{Pass} 间接触发,于是, PassManager\text{PassManager} 通过直接调用转换类 Pass\text{Pass} 方式间接调用分析类 Pass\text{Pass}

  让我们来看看 PassManager\text{PassManager} 做了什么:

// $LLVM_HOME/include/llvm/IR/PassManager.h
template <typename IRUnitT,
typename AnalysisManagerT = AnalysisManager<IRUnitT>,
typename... ExtraArgTs>
class PassManager : public PassInfoMixin<
PassManager<IRUnitT, AnalysisManagerT, ExtraArgTs...>> {
public:
PreservedAnalyses run(IRUnitT &IR, AnalysisManagerT &AM,
ExtraArgTs... ExtraArgs) {
PreservedAnalyses PA = PreservedAnalyses::all();
PassInstrumentation PI =
detail::getAnalysisResult<PassInstrumentationAnalysis>(
AM, IR, std::tuple<ExtraArgTs...>(ExtraArgs...));
for (unsigned Idx = 0, Size = Passes.size(); Idx != Size; ++Idx) {
auto *P = Passes[Idx].get();
if (!PI.runBeforePass<IRUnitT>(*P, IR))
continue;
PreservedAnalyses PassPA;
{
TimeTraceScope TimeScope(P->name(), IR.getName());
PassPA = P->run(IR, AM, ExtraArgs...);
}
PI.runAfterPass<IRUnitT>(*P, IR, PassPA);
AM.invalidate(IR, PassPA);
PA.intersect(std::move(PassPA));
}
PA.preserveSet<AllAnalysesOn<IRUnitT>>();
return PA;
}
template <typename PassT>
LLVM_ATTRIBUTE_MINSIZE
std::enable_if_t<!std::is_same<PassT, PassManager>::value>
addPass(PassT &&Pass) {
using PassModelT =
detail::PassModel<IRUnitT, PassT, PreservedAnalyses, AnalysisManagerT,
ExtraArgTs...>;
Passes.push_back(std::unique_ptr<PassConceptT>(
new PassModelT(std::forward<PassT>(Pass))));
}
template <typename PassT>
LLVM_ATTRIBUTE_MINSIZE
std::enable_if_t<std::is_same<PassT, PassManager>::value>
addPass(PassT &&Pass) {
for (auto &P : Pass.Passes)
Passes.push_back(std::move(P));
}
bool isEmpty() const { return Passes.empty(); }
static bool isRequired() { return true; }
protected:
using PassConceptT =
detail::PassConcept<IRUnitT, AnalysisManagerT, ExtraArgTs...>;
std::vector<std::unique_ptr<PassConceptT>> Passes;
};
CAUTION

  鉴于篇幅过长,上面的代码片段省略了无需关注的方法和注释。

// $LLVM_HOME/include/llvm/IR/PassManager.h
template <typename IRUnitT,
typename AnalysisManagerT = AnalysisManager<IRUnitT>,
typename... ExtraArgTs>
class PassManager : public PassInfoMixin<
PassManager<IRUnitT, AnalysisManagerT, ExtraArgTs...>> {
/* ... */
};

  PassManager\text{PassManager} 同样是一个模板类,继承自 PassInfoMixin\text{PassInfoMixin} 基类且实现了特定的 run()\text{run()} 方法,因此从技术上,PassManager\text{PassManager} 也是一个合法的 Pass\text{Pass}PassManager\text{PassManager} 拥有三个模板参数:

  • IRUnitT\text{IRUnitT},指定 PassManager\text{PassManager} 所管理 IR\text{IR} 单位类型,也就是转换类 Pass\text{Pass} 的运行粒度(Module\text{Module}Function\text{Function}Loop\text{Loop}……);
  • AnalysisManagerT\text{AnalysisManagerT},指定了 PassManager\text{PassManager} 需要用来管理分析结果的 AnalysisManager\text{AnalysisManager} 类型,默认粒度与 IRUnitT\text{IRUnitT} 保持一致,当然也可以传入其他粒度的 AnalysisManager\text{AnalysisManager}
  • ExtraArgTs\text{ExtraArgTs},这是一个可变模板参数包,允许传递额外的参数给转换类 Pass\text{Pass},比如需要多个不同粒度的 AnalysisManagerT\text{AnalysisManagerT} 时,就可以通过 ExtraArgTs\text{ExtraArgTs} 传递进去。

类型擦除 PassConcept\text{PassConcept}#

// $LLVM_HOME/include/llvm/IR/PassManager.h
template <typename IRUnitT,
typename AnalysisManagerT = AnalysisManager<IRUnitT>,
typename... ExtraArgTs>
class PassManager : public PassInfoMixin<
PassManager<IRUnitT, AnalysisManagerT, ExtraArgTs...>> {
public:
/* ... */
protected:
using PassConceptT =
detail::PassConcept<IRUnitT, AnalysisManagerT, ExtraArgTs...>;
std::vector<std::unique_ptr<PassConceptT>> Passes;
};

  PassManager\text{PassManager} 内部通过一个 vector\text{vector} 来保存其所管理的转换类 Pass\text{Pass} 列表,但并非直接保存 Pass\text{Pass} 对象或其指针,而是保存了 PassConceptT\text{PassConceptT} 智能指针。

  此处的 PassConceptT\text{PassConceptT} 实际上是一个典型的 “类型擦除Type Erasure\text{Type Erasure})” 实现。需要知道的是,尽管 PassManager\text{PassManager} 管理的是同一粒度下的转换类 Pass\text{Pass},但这些 Pass\text{Pass} 的具体类型不尽相同,毕竟存在可变模板参数 ExtraArgTs\text{ExtraArgTs},无法通过静态类型来统一表示,也就无法使用 vector\text{vector} 来统一存储。因此,需要一个抽象基类 PassConceptT\text{PassConceptT} 来隐藏具体的 Pass\text{Pass} 类型,PassManager\text{PassManager} 便可以用这个接口来统一调用。

  来看看 PassConceptT\text{PassConceptT} 的具体实现:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename AnalysisManagerT, typename... ExtraArgTs>
struct PassConcept {
virtual ~PassConcept() = default;
virtual PreservedAnalyses run(IRUnitT &IR, AnalysisManagerT &AM,
ExtraArgTs... ExtraArgs) = 0;
virtual void
printPipeline(raw_ostream &OS,
function_ref<StringRef(StringRef)> MapClassName2PassName) = 0;
virtual StringRef name() const = 0;
virtual bool isRequired() const = 0;
};

  PassConcept\text{PassConcept} 是一个纯虚类,以纯虚函数的方式定义了四个接口,包括 run()\text{run()}printPipeline()\text{printPipeline()}name()\text{name()}isRequired()\text{isRequired()},要求其派生类必须实现这些方法。

  其实你也应该发现了,PassConcept\text{PassConcept} 并非转换类 Pass\text{Pass} 的抽象基类,因为它并没有继承自 PassInfoMixin\text{PassInfoMixin},而且也没有必要。因为 PassConcept\text{PassConcept} 只是一个接口类,应该与具体的 Pass\text{Pass} 类型解耦。那么,谁来拥有一个具体的转换类 Pass\text{Pass} 对象,并实现上面定义的接口?答案是 PassModel\text{PassModel}

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename PassT, typename PreservedAnalysesT,
typename AnalysisManagerT, typename... ExtraArgTs>
struct PassModel : PassConcept<IRUnitT, AnalysisManagerT, ExtraArgTs...> {
PreservedAnalysesT run(IRUnitT &IR, AnalysisManagerT &AM,
ExtraArgTs... ExtraArgs) override {
return Pass.run(IR, AM, ExtraArgs...);
}
void printPipeline(
raw_ostream &OS,
function_ref<StringRef(StringRef)> MapClassName2PassName) override {
Pass.printPipeline(OS, MapClassName2PassName);
}
StringRef name() const override { return PassT::name(); }
template <typename T>
using has_required_t = decltype(std::declval<T &>().isRequired());
template <typename T>
static std::enable_if_t<is_detected<has_required_t, T>::value, bool>
passIsRequiredImpl() {
return T::isRequired();
}
template <typename T>
static std::enable_if_t<!is_detected<has_required_t, T>::value, bool>
passIsRequiredImpl() {
return false;
}
bool isRequired() const override { return passIsRequiredImpl<PassT>(); }
PassT Pass;
};
CAUTION

  同样这里省略了部分无需关注的方法和注释,后面不再提示。

  PassModel\text{PassModel} 继承自上面的抽象基类 PassConcept\text{PassConcept},并实现了其定义的四个接口方法。关注到 PassModel\text{PassModel} 拥有一个具体的转换类 Pass\text{Pass} 对象 PassT Pass\text{PassT Pass},在除 isRequired()\text{isRequired()} 的接口方法实现中,PassModel\text{PassModel} 都直接调用了该转换类 Pass\text{Pass} 的对应方法,从而实现了封装与调用,而对于 isRequired()\text{isRequired()} 方法,则通过检测具体的转换类 Pass\text{Pass} 类型是否实现了该方法,来决定是否调用,若没有则直接返回 false\text{false}

  转换类 Pass\text{Pass} 继承自 PassInfoMixin\text{PassInfoMixin},基类 PassInfoMixin\text{PassInfoMixin} 提供了 name()\text{name()}printPipeline\text{printPipeline} 的默认实现,因此,对于转换类 Pass\text{Pass} 而言,必须实现的只有 run()\text{run()} 方法,这为后续自定义 Pass\text{Pass} 提供了指引。

using PassConceptT =
detail::PassConcept<IRUnitT, AnalysisManagerT, ExtraArgTs...>;
std::vector<std::unique_ptr<PassConceptT>> Passes;

  PassManager\text{PassManager} 内部通过 PassConceptT\text{PassConceptT} 的智能指针来保存其所管理的转换类 Pass\text{Pass} 列表,这是一种动态多态的实现方式,运行时,基类指针会指向具体的 PassModel\text{PassModel} 对象,从而实现对不同类型转换类 Pass\text{Pass} 的统一管理与调用。

NPM 部分关系图

run()\text{run()}:真正的调度执行入口#

  在介绍 PassManager\text{PassManager}run()\text{run()} 方法前,有必要先介绍一下 PreservedAnalyses\text{PreservedAnalyses}。观察 run()\text{run()} 方法的返回值类型和局部变量类型,可以发现都使用了 PreservedAnalyses\text{PreservedAnalyses} 这个类。

  我并不准备在这里对 PreservedAnalyses\text{PreservedAnalyses} 进行详细的剖析,而是做一些概念性的引入。PreservedAnalyses\text{PreservedAnalyses} 用于表示在某个转换类 Pass\text{Pass} 执行后,哪些分析结果仍然有效(这些分析结果是由分析类 Pass\text{Pass} 计算得到并缓存的)。因为转换类 Pass\text{Pass} 可能会修改 IR\text{IR},从而导致某些分析结果失效,所以每个转换类 Pass\text{Pass} 在执行完毕后,都需要返回一个 PreservedAnalyses\text{PreservedAnalyses} 对象,告诉 PassManager\text{PassManager} 哪些分析结果仍然有效,而哪些需要被废弃

  回到 PassManager\text{PassManager}run()\text{run()} 方法:

// $LLVM_HOME/include/llvm/IR/PassManager.h
PreservedAnalyses run(IRUnitT &IR, AnalysisManagerT &AM,
ExtraArgTs... ExtraArgs) {
PreservedAnalyses PA = PreservedAnalyses::all();
PassInstrumentation PI =
detail::getAnalysisResult<PassInstrumentationAnalysis>(
AM, IR, std::tuple<ExtraArgTs...>(ExtraArgs...));
for (unsigned Idx = 0, Size = Passes.size(); Idx != Size; ++Idx) {
auto *P = Passes[Idx].get();
if (!PI.runBeforePass<IRUnitT>(*P, IR))
continue;
PreservedAnalyses PassPA;
{
TimeTraceScope TimeScope(P->name(), IR.getName());
PassPA = P->run(IR, AM, ExtraArgs...);
}
PI.runAfterPass<IRUnitT>(*P, IR, PassPA);
AM.invalidate(IR, PassPA);
PA.intersect(std::move(PassPA));
}
PA.preserveSet<AllAnalysesOn<IRUnitT>>();
return PA;
}

  你应该注意到了,PassManager\text{PassManager}run()\text{run()} 方法本身就是一个转换类 Pass\text{Pass}run()\text{run()} 实现。这也是为什么前面指明,从技术上来看,PassManager\text{PassManager} 本身也是一个合法的 Pass\text{Pass} 实现。

  考虑 run()\text{run()} 的参数列表,其中 IRUnitT &IR\text{IRUnitT \&IR} 是当前 PassManager\text{PassManager} 所管理的 IR\text{IR} 单位对象的引用,这是一个具体的 IR\text{IR} 实例,比如某个 Module\text{Module} 或者 Function\text{Function} 等,不要理解为 IRUnitT\text{IRUnitT} 粒度下的所有单位对象,而是其中具体的一个。传入哪个具体的 IRUnitT\text{IRUnitT} 对象不是 PassManager\text{PassManager} 负责的,而是由上层调用者决定,这点很重要。当然,对其他的 Pass\text{Pass} 也是如此。

  关注 run()\text{run()} 方法的实现细节:

PreservedAnalyses PA = PreservedAnalyses::all();

  这里 PA\text{PA} 是一个通过 PreservedAnalyses::all()\text{PreservedAnalyses::all()} 静态方法创建的 PreservedAnalyses\text{PreservedAnalyses} 对象,表示初始状态下,所有分析结果均有效。这是一个乐观的初始化,后续会根据每个转换类 Pass\text{Pass} 的执行逐步收紧。

PassInstrumentation PI =
detail::getAnalysisResult<PassInstrumentationAnalysis>(
AM, IR, std::tuple<ExtraArgTs...>(ExtraArgs...));

  getAnalysisResult\text{getAnalysisResult} 获取了特定 Pass\text{Pass}——PassInstrumentationAnalysis\text{PassInstrumentationAnalysis} 的一个分析结果对象 PI\text{PI}PassInstrumentationAnalysis\text{PassInstrumentationAnalysis} 是一个特殊的分析类 Pass\text{Pass},用于在 Pass\text{Pass} 执行前后插入钩子函数,从而实现对 Pass\text{Pass} 执行过程的监控和记录,而其返回分析结果——PassInstrumentation\text{PassInstrumentation} 对象中则包含了一系列用于监控和度量的方法的入口。

  我不准备详细介绍 PassInstrumentation\text{PassInstrumentation} 的实现细节,只需要知道其提供了两个方法:runBeforePass\text{runBeforePass}runAfterPass\text{runAfterPass},分别在每个转换类 Pass\text{Pass} 执行前后被调用,用于插入监控逻辑(比如在执行前判断是否需要跳过该 Pass\text{Pass} 的执行等)。

for (unsigned Idx = 0, Size = Passes.size(); Idx != Size; ++Idx) {
auto *P = Passes[Idx].get();
if (!PI.runBeforePass<IRUnitT>(*P, IR))
continue;
PreservedAnalyses PassPA;
{
TimeTraceScope TimeScope(P->name(), IR.getName());
PassPA = P->run(IR, AM, ExtraArgs...);
}
PI.runAfterPass<IRUnitT>(*P, IR, PassPA);
AM.invalidate(IR, PassPA);
PA.intersect(std::move(PassPA));
}

  核心部分的逻辑就比较简单了,遍历 PassManager\text{PassManager} 内部保存的所有转换类 Pass\text{Pass} 列表,依次执行每个 Pass\text{Pass}。当然,在 Pass\text{Pass} 执行前后调用了 PassInstrumentation\text{PassInstrumentation} 提供的方法进行监控和记录。

  需要关注的是,AnalysisManager\text{AnalysisManager}AM\text{AM})会在每个转换类 Pass\text{Pass} 执行结束后,根据该 Pass\text{Pass} 返回的 PreservedAnalyses\text{PreservedAnalyses},通过 invalidate()\text{invalidate()} 方法即时废除那些被标记为失效的分析结果缓存。与此同时,PassManager\text{PassManager} 维护的聚合 PreservedAnalyses\text{PreservedAnalyses}PA\text{PA})则通过不断调用 intersect()\text{intersect()} 方法逐步收紧,并最终作为该 PassManager\text{PassManager} 整体的保留分析集合返回给上层调用者。

AnalysisManager\text{AnalysisManager}:分析结果的管理与缓存#

  AnalysisManager\text{AnalysisManager} 类模板定义与核心成员如下:

// $LLVM_HOME/include/llvm/IR/PassManager.h
template <typename IRUnitT, typename... ExtraArgTs>
class AnalysisManager {
public:
class Invalidator;
private:
using ResultConceptT =
detail::AnalysisResultConcept<IRUnitT, PreservedAnalyses, Invalidator>;
using PassConceptT =
detail::AnalysisPassConcept<IRUnitT, PreservedAnalyses, Invalidator,
ExtraArgTs...>;
using AnalysisResultListT =
std::list<std::pair<AnalysisKey *, std::unique_ptr<ResultConceptT>>>;
using AnalysisResultListMapT = DenseMap<IRUnitT *, AnalysisResultListT>;
using AnalysisResultMapT =
DenseMap<std::pair<AnalysisKey *, IRUnitT *>,
typename AnalysisResultListT::iterator>;
using AnalysisPassMapT =
DenseMap<AnalysisKey *, std::unique_ptr<PassConceptT>>;
AnalysisPassMapT AnalysisPasses;
AnalysisResultListMapT AnalysisResultLists;
AnalysisResultMapT AnalysisResults;
};

  同样,我们先关注 AnalysisManager\text{AnalysisManager} 的模板参数。和 PassManager\text{PassManager} 一样,IRUnitT\text{IRUnitT} 指定了 AnalysisManager\text{AnalysisManager} 所管理的 IR\text{IR} 单位类型,而 ExtraArgTs\text{ExtraArgTs} 同样是一个可变模板参数包,用于传递额外的参数给分析类 Pass\text{Pass}

类型擦除 AnalysisPassConcept\text{AnalysisPassConcept}AnalysisResultConcept\text{AnalysisResultConcept}#

  在私有成员中,AnalysisPasses\text{AnalysisPasses} 保存了所有注册的分析类 Pass\text{Pass},其类型为 AnalysisPassMapT\text{AnalysisPassMapT},即以 AnalysisKey*\text{AnalysisKey*} 为键,PassConceptT\text{PassConceptT} 智能指针为值的 DenseMap\text{DenseMap}PassConceptT\text{PassConceptT}AnalysisPassConcept\text{AnalysisPassConcept} 的一个类型别名,看到此处,你应该已经猜到了,此处的 PassConceptT\text{PassConceptT} 也是一个 “类型擦除” 的实现。

  我们来看看抽象基类 AnalysisPassConcept\text{AnalysisPassConcept} 的定义:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename PreservedAnalysesT, typename InvalidatorT,
typename... ExtraArgTs>
struct AnalysisPassConcept {
virtual ~AnalysisPassConcept() = default;
virtual std::unique_ptr<
AnalysisResultConcept<IRUnitT, PreservedAnalysesT, InvalidatorT>>
run(IRUnitT &IR, AnalysisManager<IRUnitT, ExtraArgTs...> &AM,
ExtraArgTs... ExtraArgs) = 0;
virtual StringRef name() const = 0;
};

  可以看到,AnalysisPassConcept\text{AnalysisPassConcept} 定义了两个纯虚函数:run()\text{run()}name()\text{name()} 作为派生类必须实现的接口。于是,我们查看其派生类 AnalysisPassModel\text{AnalysisPassModel} 实现:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename PassT, typename PreservedAnalysesT,
typename InvalidatorT, typename... ExtraArgTs>
struct AnalysisPassModel : AnalysisPassConcept<IRUnitT, PreservedAnalysesT,
InvalidatorT, ExtraArgTs...> {
using ResultModelT =
AnalysisResultModel<IRUnitT, PassT, typename PassT::Result,
PreservedAnalysesT, InvalidatorT>;
std::unique_ptr<
AnalysisResultConcept<IRUnitT, PreservedAnalysesT, InvalidatorT>>
run(IRUnitT &IR, AnalysisManager<IRUnitT, ExtraArgTs...> &AM,
ExtraArgTs... ExtraArgs) override {
return std::make_unique<ResultModelT>(
Pass.run(IR, AM, std::forward<ExtraArgTs>(ExtraArgs)...));
}
StringRef name() const override { return PassT::name(); }
PassT Pass;
};

  我们只关注 run()\text{run()} 接口实现。AnalysisPassModel\text{AnalysisPassModel} 同样拥有一个具体的分析类 Pass\text{Pass},并在 run()\text{run()} 方法中调用了该 Pass\text{Pass}run()\text{run()} 方法,获取其分析结果后,封装为 ResultModelT\text{ResultModelT} 智能指针并返回。看到这里,我们应该明白,AnalysisPassModel\text{AnalysisPassModel} 对分析类 Pass\text{Pass} 的实现同样有具体的约束,即必须实现 run()\text{run()} 方法,并返回一个分析结果对象。

  仔细考虑 run()\text{run()} 方法中的这句代码:

return std::make_unique<ResultModelT>(
Pass.run(IR, AM, std::forward<ExtraArgTs>(ExtraArgs)...));

  你可能会想,Pass.run()\text{Pass.run()} 返回值用于构造 ResultModelT\text{ResultModelT} 的智能指针,那 Pass.run()Pass.run() 肯定返回一个 ResultModelT\text{ResultModelT} 的对象 。对吗?不对!想要确定分析类 Pass\text{Pass} 究竟返回什么类型的分析结果,我们需要剖析另一个 “类型擦除” 的实现—— AnalysisResultConcept\text{AnalysisResultConcept}

template <typename IRUnitT, typename PreservedAnalysesT, typename InvalidatorT>
struct AnalysisResultConcept {
virtual ~AnalysisResultConcept() = default;
virtual bool invalidate(IRUnitT &IR, const PreservedAnalysesT &PA,
InvalidatorT &Inv) = 0;
};

  和 Pass\text{Pass} 一样,分析结果也有不同的静态类型,如何将其统一存储管理,就需要借助 AnalysisResultConcept\text{AnalysisResultConcept} 实现分析结果的 “类型擦除”。看看其定义的纯虚函数,只有一个 invalidate()\text{invalidate()} 接口,这是用于分析结果失效检查的方法,这部分后面会详细介绍。AnalysisResultModel\text{AnalysisResultModel} 继承自此抽象基类:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename PassT, typename ResultT,
typename PreservedAnalysesT, typename InvalidatorT>
struct AnalysisResultModel<IRUnitT, PassT, ResultT, PreservedAnalysesT,
InvalidatorT, false>
: AnalysisResultConcept<IRUnitT, PreservedAnalysesT, InvalidatorT> {
explicit AnalysisResultModel(ResultT Result) : Result(std::move(Result)) {}
AnalysisResultModel(const AnalysisResultModel &Arg) : Result(Arg.Result) {}
AnalysisResultModel(AnalysisResultModel &&Arg)
: Result(std::move(Arg.Result)) {}
bool invalidate(IRUnitT &, const PreservedAnalysesT &PA,
InvalidatorT &) override {
auto PAC = PA.template getChecker<PassT>();
return !PAC.preserved() &&
!PAC.template preservedSet<AllAnalysesOn<IRUnitT>>();
}
ResultT Result;
};

  我们先解决前面的问题:

return std::make_unique<ResultModelT>(
Pass.run(IR, AM, std::forward<ExtraArgTs>(ExtraArgs)...));

  Pass.run()\text{Pass.run()} 返回了一个分析结果对象 Result\text{Result} 后,实际上调用了 AnalysisResultModel(ResultT Result)\text{AnalysisResultModel(ResultT Result)} 构造函数,构造了一个包含该分析结果的 AnalysisResultModel\text{AnalysisResultModel} 对象。

IMPORTANT

  现在我们基本上勾勒出了分析类 Pass\text{Pass} 的 “形状”。在前面介绍 Pass\text{Pass} 分类与类设计时提到,分析类 Pass\text{Pass} 都必须定义一个 AnalysisKey\text{AnalysisKey} 作为其唯一的身份标识,这里我们又要求分析类 Pass\text{Pass} 需要实现一个 run()\text{run()} 方法,该方法返回一个分析结果对象。

  实际上这里对分析结果对象并没有过多的约束。你可能注意到,AnalysisResultModel\text{AnalysisResultModel}invalidate()\text{invalidate()} 实现并没有调用任何与 Result\text{Result} 相关的方法,这实际上是 LLVM\text{LLVM} 的一个设计哲学。AnalysisResultModel\text{AnalysisResultModel} 被设计为分析结果提供统一接口,当然也包括一套默认的失效检查方法的实现,即 invalidate()\text{invalidate()} 方法。AnalysisManager\text{AnalysisManager} 通过 AnalysisResultModel\text{AnalysisResultModel} 实现对分析结果的统一管理,AM\text{AM} 在检查分析结果是否失效时正是调用了这里的统一接口实现。这当然也降低了自定义 Pass\text{Pass} 编写的复杂度。

IMPORTANT

  你可能会想,如果我自定义的分析类 Pass\text{Pass} 的分析结果对象 Result\text{Result} 需要自定义的失效检查方法呢,又该如何实现?很简单,借助模板特化。实际上自定义实现失效检查方法是一个相当普遍的需求,因为当一个分析类 Pass\text{Pass} 依赖其他分析结果时,就必须自定义分析结果类的失效检查方法。如何实现 AnalysisResultModel\text{AnalysisResultModel} 针对特定实现了自定义 invalidate()\text{invalidate()} 方法的分析结果类的特化呢,需要自己编写吗?答案是不用!

  不知道你是否注意到上面 AnalysisResultModel\text{AnalysisResultModel} 模板参数中的 false\text{false},其实还存在一个对应的 true\text{true} 版本的 AnalysisResultModel\text{AnalysisResultModel} 实现:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename PassT, typename ResultT,
typename PreservedAnalysesT, typename InvalidatorT>
struct AnalysisResultModel<IRUnitT, PassT, ResultT, PreservedAnalysesT,
InvalidatorT, true>
: AnalysisResultConcept<IRUnitT, PreservedAnalysesT, InvalidatorT> {
explicit AnalysisResultModel(ResultT Result) : Result(std::move(Result)) {}
bool invalidate(IRUnitT &IR, const PreservedAnalysesT &PA,
InvalidatorT &Inv) override {
return Result.invalidate(IR, PA, Inv);
}
ResultT Result;
};

  在这个版本里,invalidate()\text{invalidate()} 调用了分析结果 Result\text{Result} 自定义实现的 invalidate()\text{invalidate()} 方法。

  这里的模板参数 false\text{false}true\text{true} 是怎么来的,有何含义?相信你已经猜到了,true\text{true} 版本对应分析结果类实现了自定义失效检查方法的情况,false\text{false} 则对应了未实现而使用默认检查逻辑的情况,这两个都是特化(偏特化)的版本。我们可以看看主模板声明:

template <typename IRUnitT, typename PassT, typename ResultT,
typename PreservedAnalysesT, typename InvalidatorT,
bool HasInvalidateHandler =
ResultHasInvalidateMethod<IRUnitT, ResultT>::Value>
struct AnalysisResultModel;

  其中类型模板参数 HasInvalidateHandler\text{HasInvalidateHandler} 就是上面两个偏特化版本的来源。这里不深入讨论 LLVM\text{LLVM} 内部提供的 SFINAE\text{SFINAE} 方法,只需要知道:当 ResultT\text{ResultT} 实现了自定义 invalidate()\text{invalidate()} 方法时,HasInvalidateHandler\text{HasInvalidateHandler}true\text{true},否则为 false\text{false},这些都是在编译期可确定的,于是根据这个结果特化出两个偏特化版本。

TIP

  true\text{true} 模板参数对应于的偏特化版本正是后面失效检查时依赖传递实现的基础。

  在 AnalysisManager\text{AnalysisManager} 余下的私有成员中,AnalysisResultLists\text{AnalysisResultLists} 保存了具体的 IRUnitT\text{IRUnitT} 实例指针到 AnalysisResultListT\text{AnalysisResultListT} 的映射,其中 AnalysisResultListT\text{AnalysisResultListT} 是一个链表,链上节点存储着分析类 Pass\text{Pass} 的唯一标识和其对应的分析结果。而 AnalysisResults\text{AnalysisResults} 则保存了 <AnalysisKey *, IRUnitT *>\text{<AnalysisKey *, IRUnitT *>}AnalysisResultListT::iterator\text{AnalysisResultListT::iterator} 的映射,即给出了具体分析类 Pass\text{Pass} 在具体 IRUnitT\text{IRUnitT} 下的分析结果指针(迭代器)。

失效器:Invalidator\text{Invalidator}#

  AnalysisManager\text{AnalysisManager} 实现分析结果的管理和缓存很重要的一个任务就是做好分析结果失效状态的管理和更新。AnalysisManager\text{AnalysisManager} 类定义了一个嵌套类,用于分析结果的失效检查:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
class Invalidator {
public:
template <typename PassT>
bool invalidate(IRUnitT &IR, const PreservedAnalyses &PA) {
using ResultModelT =
detail::AnalysisResultModel<IRUnitT, PassT, typename PassT::Result,
PreservedAnalyses, Invalidator>;
return invalidateImpl<ResultModelT>(PassT::ID(), IR, PA);
}
bool invalidate(AnalysisKey *ID, IRUnitT &IR, const PreservedAnalyses &PA) {
return invalidateImpl<>(ID, IR, PA);
}
private:
friend class AnalysisManager;
template <typename ResultT = ResultConceptT>
bool invalidateImpl(AnalysisKey *ID, IRUnitT &IR,
const PreservedAnalyses &PA) {
auto IMapI = IsResultInvalidated.find(ID);
if (IMapI != IsResultInvalidated.end())
return IMapI->second;
auto RI = Results.find({ID, &IR});
assert(RI != Results.end() &&
"Trying to invalidate a dependent result that isn't in the "
"manager's cache is always an error, likely due to a stale result "
"handle!");
auto &Result = static_cast<ResultT &>(*RI->second->second);
bool Inserted;
std::tie(IMapI, Inserted) =
IsResultInvalidated.insert({ID, Result.invalidate(IR, PA, *this)});
(void)Inserted;
assert(Inserted && "Should not have already inserted this ID, likely "
"indicates a dependency cycle!");
return IMapI->second;
}
Invalidator(SmallDenseMap<AnalysisKey *, bool, 8> &IsResultInvalidated,
const AnalysisResultMapT &Results)
: IsResultInvalidated(IsResultInvalidated), Results(Results) {}
SmallDenseMap<AnalysisKey *, bool, 8> &IsResultInvalidated;
const AnalysisResultMapT &Results;
};

  Invaildtor\text{Invaildtor} 负责管理和传播分析结果的失效,我们只需要将关注点放在 invalidate()\text{invalidate()} 方法的实现上,Invaildtor\text{Invaildtor} 提供了两个 invalidate()\text{invalidate()} 的实现:

template <typename PassT>
bool invalidate(IRUnitT &IR, const PreservedAnalyses &PA) {
using ResultModelT =
detail::AnalysisResultModel<IRUnitT, PassT, typename PassT::Result,
PreservedAnalyses, Invalidator>;
return invalidateImpl<ResultModelT>(PassT::ID(), IR, PA);
}
bool invalidate(AnalysisKey *ID, IRUnitT &IR, const PreservedAnalyses &PA) {
return invalidateImpl<>(ID, IR, PA);
}

  这两种实现都使用了同一个核心方法 invalidateImpl()\text{invalidateImpl()}。尽管都是对同一方法的封装,但两者却存在明显的区别,特别是在运行性能上。看看 invalidateImpl()\text{invalidateImpl()} 的具体实现:

template <typename ResultT = ResultConceptT>
bool invalidateImpl(AnalysisKey *ID, IRUnitT &IR,
const PreservedAnalyses &PA) {
auto IMapI = IsResultInvalidated.find(ID);
if (IMapI != IsResultInvalidated.end())
return IMapI->second;
auto RI = Results.find({ID, &IR});
assert(RI != Results.end() &&
"Trying to invalidate a dependent result that isn't in the "
"manager's cache is always an error, likely due to a stale result "
"handle!");
auto &Result = static_cast<ResultT &>(*RI->second->second);
bool Inserted;
std::tie(IMapI, Inserted) =
IsResultInvalidated.insert({ID, Result.invalidate(IR, PA, *this)});
(void)Inserted;
assert(Inserted && "Should not have already inserted this ID, likely "
"indicates a dependency cycle!");
return IMapI->second;
}

  invalidateImpl()\text{invalidateImpl()} 首先检查了当前标识对应的分析类 Pass\text{Pass} 是否已经进行过失效检查,若没有则根据标识和具体的 IRUnitT\text{IRUnitT} 实例获取指向对应分析结果的迭代器,并通过 static_cast\text{static\_cast} 获取对应的分析结果 Result\text{Result},最后通过 Result\text{Result} 调用 invalidate()\text{invalidate()} 执行失效检查逻辑。

  第一种实现将模板参数 ResultModelT\text{ResultModelT} 传递给了 invalidateImpl()\text{invalidateImpl()},使其在编译期便获知分析结果的具体类型,因此后续通过 Result\text{Result} 调用 invalidate()\text{invalidate()} 是通过静态类型调用的方式,这一点很重要。而对于 invalidate()\text{invalidate()} 的第二种实现,并没有传递具体的分析结果类型参数 ResultT\text{ResultT},因此 invalidateImpl()\text{invalidateImpl()} 使用了默认的类型模板参数,即 ResultT = ResultConcept\text{ResultT = ResultConcept}。也许你仍记得,ResultConcept\text{ResultConcept} 是抽象基类,因此在通过 Result\text{Result} 调用 invalidate()\text{invalidate()} 方法时其实是通过虚函数实现的动态分派。这就是两者存在的关键区别,也是运行性能差异的关键所在。

IMPORTANT

  我们说 Invalidator\text{Invalidator} 支持依赖传播的失效检查,其实在分析 AnalysisResultModel\text{AnalysisResultModel} 模板特化的时候已经有所体现。当一个分析类 Pass\text{Pass} A\text{A} 依赖其他分析类 Pass\text{Pass} B\text{B} 的分析结果时,为保证 A\text{A} 的分析结果在 B\text{B} 失效时也能及时标识失效,LLVM\text{LLVM} 采用了依赖者主动检查,即 Pull\text{Pull} 模式。在这种模式下,Pass\text{Pass} A\text{A} 需要在其分析结果类中实现自定义的 invalidate()\text{invalidate()} 方法,并在方法内部主动调用 Invalidator\text{Invalidator} 去检查其所依赖的 Pass\text{Pass} B\text{B} 的分析结果是否失效,从而实现失效信息的传播。

AnalysisManager\text{AnalysisManager}:分析结果的失效管理#

  前面我们介绍了 Invalidator\text{Invalidator} 提供的对具体分析结果 Result\text{Result} 执行具有依赖传播的失效检查,那么 AnalysisManager\text{AnalysisManager} 是如何借助 Invalidator\text{Invalidator} 实现其所管理分析类 Pass\text{Pass} 分析结果的统一失效检查?

  我们查看 AnalysisManager\text{AnalysisManager}invalidate()\text{invalidate()} 方法的具体实现:

// $LLVM_HOME/include/llvm/IR/PassManagerImpl.h
template <typename IRUnitT, typename... ExtraArgTs>
inline void AnalysisManager<IRUnitT, ExtraArgTs...>::invalidate(
IRUnitT &IR, const PreservedAnalyses &PA) {
if (PA.allAnalysesInSetPreserved<AllAnalysesOn<IRUnitT>>())
return;
SmallDenseMap<AnalysisKey *, bool, 8> IsResultInvalidated;
Invalidator Inv(IsResultInvalidated, AnalysisResults);
AnalysisResultListT &ResultsList = AnalysisResultLists[&IR];
for (auto &AnalysisResultPair : ResultsList) {
AnalysisKey *ID = AnalysisResultPair.first;
auto &Result = *AnalysisResultPair.second;
auto IMapI = IsResultInvalidated.find(ID);
if (IMapI != IsResultInvalidated.end())
continue;
bool Inserted =
IsResultInvalidated.insert({ID, Result.invalidate(IR, PA, Inv)}).second;
(void)Inserted;
assert(Inserted && "Should never have already inserted this ID, likely "
"indicates a cycle!");
}
if (!IsResultInvalidated.empty()) {
for (auto I = ResultsList.begin(), E = ResultsList.end(); I != E;) {
AnalysisKey *ID = I->first;
if (!IsResultInvalidated.lookup(ID)) {
++I;
continue;
}
if (auto *PI = getCachedResult<PassInstrumentationAnalysis>(IR))
PI->runAnalysisInvalidated(this->lookUpPass(ID), IR);
I = ResultsList.erase(I);
AnalysisResults.erase({ID, &IR});
}
}
if (ResultsList.empty())
AnalysisResultLists.erase(&IR);
}

  AnalysisManager::invalidate()\text{AnalysisManager::invalidate()} 实现可以分为两个部分。

SmallDenseMap<AnalysisKey *, bool, 8> IsResultInvalidated;
Invalidator Inv(IsResultInvalidated, AnalysisResults);
AnalysisResultListT &ResultsList = AnalysisResultLists[&IR];
for (auto &AnalysisResultPair : ResultsList) {
AnalysisKey *ID = AnalysisResultPair.first;
auto &Result = *AnalysisResultPair.second;
auto IMapI = IsResultInvalidated.find(ID);
if (IMapI != IsResultInvalidated.end())
continue;
bool Inserted =
IsResultInvalidated.insert({ID, Result.invalidate(IR, PA, Inv)}).second;
(void)Inserted;
assert(Inserted && "Should never have already inserted this ID, likely "
"indicates a cycle!");
}

  首先遍历具体 IRUnitT\text{IRUnitT} 实例对应的分析结果列表,取出每个节点记录的分析类 Pass\text{Pass} 的唯一标识和对应分析结果 Result\text{Result}。通过 Result\text{Result} 调用 invalidate()\text{invalidate()} 执行失效检查逻辑(不要忘了,这里的 Result\text{Result} 实际上是 AnalysisResultModel\text{AnalysisResultModel}),并将检查结果插入到 IsResultInvalidated\text{IsResultInvalidated} 中。

IMPORTANT

  IsResultInvalidated\text{IsResultInvalidated}AnalysisManager\text{AnalysisManager} 在一次失效检查过程中维护的判定缓存表,扮演了关键的角色。依赖传播是递归的,而同一个分析结果的失效判定只能做一次,否则重复调用 invalidate()\text{invalidate()} 方法带来的将是指数级的复杂度。

  可以确保的是 LLVM\text{LLVM} 不存在分析结果的循环依赖,失效检查方法 invalidate()\text{invalidate()} 也就不会存在无穷递归的情况,你可以思考一下为什么(但是 Pass\text{Pass} 之间的循环依赖却可能造成 run()\text{run()} 方法的无穷递归调用)。

if (!IsResultInvalidated.empty()) {
for (auto I = ResultsList.begin(), E = ResultsList.end(); I != E;) {
AnalysisKey *ID = I->first;
if (!IsResultInvalidated.lookup(ID)) {
++I;
continue;
}
if (auto *PI = getCachedResult<PassInstrumentationAnalysis>(IR))
PI->runAnalysisInvalidated(this->lookUpPass(ID), IR);
I = ResultsList.erase(I);
AnalysisResults.erase({ID, &IR});
}
}

  当失效检查标记完所有分析结果缓存后才开始执行真正的失效”的过程。遍历 IRUnitT\text{IRUnitT} 实例对应的分析结果列表,根据失效判定缓存表 IsResultInvalidated\text{IsResultInvalidated} 中存储的结果,当标记为 true\text{true} 是将改分析结果缓存移除(即失效),否则跳过仍保留该分析结果缓存。

  逻辑相对简单,但是我们仍可以有很多思考。在 AnalysisManager\text{AnalysisManager} 对分析结果缓存执行失效检查过程中,失效器 Inv\text{Inv} 的角色是什么?我们回顾 AnalysisResultModel\text{AnalysisResultModel} 提供的 invalidate()\text{invalidate()} 接口实现:

// $LLVM_HOME/include/llvm/IR/PassManagerInternal.h
template <typename IRUnitT, typename PassT, typename ResultT,
typename PreservedAnalysesT, typename InvalidatorT>
struct AnalysisResultModel<IRUnitT, PassT, ResultT, PreservedAnalysesT,
InvalidatorT, true>
: AnalysisResultConcept<IRUnitT, PreservedAnalysesT, InvalidatorT> {
explicit AnalysisResultModel(ResultT Result) : Result(std::move(Result)) {}
bool invalidate(IRUnitT &IR, const PreservedAnalysesT &PA,
InvalidatorT &Inv) override {
return Result.invalidate(IR, PA, Inv);
}
ResultT Result;
};

  可以看到,其只是简单地将失效器 Inv\text{Inv} 传递给了分析结果类自定义实现的失效检查方法 invalidate()\text{invalidate()} 中,为什么呢,你可能会有疑问:难道分析结果类 invalidate()\text{invalidate()} 方法就必须借助失效器 Inv\text{Inv} 来执行所依赖分析结果的失效检查逻辑,不能直接调用所依赖分析结果的 invalidate()\text{invalidate()} 方法吗?答案是不能,因为不借助失效器 Inv\text{Inv} 根本拿不到该分析结果。我们不妨看看分析结果类 invalidate()\text{invalidate()} 的方法签名:

bool invalidate(IRUnitT &IR,
const PreservedAnalyses &PA,
Invalidator &Inv);

  发现根本没有传入任何 AnalysisManager\text{AnalysisManager}AnalysisResultMap\text{AnalysisResultMap} 等可以获取到指定分析结果缓存的参数。而 Invalidator\text{Invalidator} 中恰好保存了 Results\text{Results}

const AnalysisResultMapT &Results

  当然这不是唯一的原因,失效器 Inv\text{Inv} 的另一个作用是传递失效判定缓存 IsResultInvalidated\text{IsResultInvalidated},其作用这里就不用赘述了吧。

TIP

  前面我们也提到过,分析类 Pass\text{Pass} 采用所谓的 “按需计算” 的策略,只有当某转换类 Pass\text{Pass} 依赖其分析结果,且缓存没有命中时才会触发该分析类 Pass\text{Pass} 的执行。这里需要注意的是,这部分逻辑并不由转换类 Pass\text{Pass} 实现,而是交由 AnalysisManager\text{AnalysisManager} 负责管理,这也是会在转换类 Pass\text{Pass}run()\text{run()} 方法函数签名中看到 AnalysisManager\text{AnalysisManager} 的原因:

PreservedAnalysesT run(IRUnitT &IR, AnalysisManagerT &AM,
ExtraArgTs... ExtraArgs)

PassManager关系图

动手写一个 Pass\text{Pass}#

  我们已经学习了编写一个 Pass\text{Pass} 需要得一切基础知识,现在让我们动手写一个分析类 Pass\text{Pass} 用于打印一个 Module\text{Module} 实例中所有函数名称及其所含基本块数目(跳过函数声明)。

  回顾一下,分析类 Pass\text{Pass} 继承自 AnalysisInfoMixin\text{AnalysisInfoMixin},并且有一个静态成员变量 AnalysisKey\text{AnalysisKey} Key\text{Key} 作为其唯一得标识。

#include "llvm/IR/PassManager.h"
struct FuncBBCountAnalysis: llvm::AnalysisInfoMixin<FuncBBCountAnalysis> {
// 分析类 Pass ID
static llvm::AnalysisKey Key;
};

  此外,我们需要为其定义 run()\text{run()} 方法,以实现该 Pass\text{Pass} 具体逻辑,不过在此之前,需要定义一个分析结果类作为 run()\text{run()} 方法返回的分析结果。

#include "llvm/IR/PassManager.h"
#include <map>
// 前向声明
struct FuncBBCountAnalysis;
// 分析结果类
struct FuncBBCountResult {
std::map<std::string, unsigned> FuncBBMap;
// 失效检查方法,可以省略
bool invalidate(llvm::Module &M, const llvm::PreservedAnalyses &PA
, llvm::ModuleAnalysisManager::Invalidator &Inv) {
auto PAC = PA.getChecker<FuncBBCountAnalysis>();
if (PAC.preserved() || PAC.preservedSet<llvm::AllAnalysesOn<llvm::Module>>()) {
return false;
}
return true;
}
};
struct FuncBBCountAnalysis: llvm::AnalysisInfoMixin<FuncBBCountAnalysis> {
// Pass ID
static llvm::AnalysisKey Key;
};

  你应该发现了,这里定义的分析结果类的 invalidate()\text{invalidate()} 方法与 AnalysisPassModel\text{AnalysisPassModel} 提供的默认失效检查逻辑是一致的。我们将要实现的 FuncBBCountAnalysis\text{FuncBBCountAnalysis} Pass\text{Pass} 并不依赖任何其他分析结果,因此这里可以省略编写 invalidate()\text{invalidate()} 而使用默认实现。

#include "llvm/IR/PassManager.h"
#include <map>
// 不再需要
// // 前向声明
// struct FuncBBCountAnalysis;
// 分析结果类
struct FuncBBCountResult {
std::map<std::string, unsigned> FuncBBMap;
// 省略
// // 失效检查方法,可以省略
// bool invalidate(llvm::Module &M, const llvm::PreservedAnalyses &PA
// , llvm::ModuleAnalysisManager::Invalidator &Inv) {
// auto PAC = PA.getChecker<FuncBBCountAnalysis>();
// if (PAC.preserved() || PAC.preservedSet<llvm::AllAnalysesOn<llvm::Module>>()) {
// return false;
// }
// return true;
// }
};
struct FuncBBCountAnalysis: llvm::AnalysisInfoMixin<FuncBBCountAnalysis> {
// Pass ID
static llvm::AnalysisKey Key;
};

  现在有了分析结果类 FuncBBCountResult\text{FuncBBCountResult},那么就可以着手 run()\text{run()} 方法的编写了。逻辑比较简单:遍历 Module\text{Module} 中的所有 Function\text{Function} 并通过相关接口获取信息即可:

/// ModuleFuncBBPrinter.h
/// Header file for Module Function Basic Block Printer Pass
#ifndef MODULE_FUNC_BB_PRINTER_H
#define MODULE_FUNC_BB_PRINTER_H
#include "llvm/IR/PassManager.h"
#include "llvm/IR/Module.h"
#include <string>
#include <map>
// 分析结果类:存储[函数名->基本块数目]的映射
struct FuncBBCountResult {
std::map<std::string, unsigned> FuncBBMap;
};
struct FuncBBCountAnalysis: llvm::AnalysisInfoMixin<FuncBBCountAnalysis> {
using Result = FuncBBCountResult;
Result run(llvm::Module &M, llvm::ModuleAnalysisManager &AM) {
FuncBBCountResult Result;
// 遍历 Module 中的所有函数
for (auto &F: M){
// 跳过声明
if (F.isDeclaration()) continue;
std::string FuncName = F.getName().str();
unsigned BBCount = F.size();
llvm::errs() << "Function: " << FuncName << ", Basic Blocks: " << BBCount << "\n";
Result.FuncBBMap[FuncName] = BBCount;
}
return Result;
}
// Pass ID
static llvm::AnalysisKey Key;
};
#endif

  这个分析类 Pass\text{Pass} 我们就编写完成了,前面讲过,分析类 Pass\text{Pass} 需要通过转换类 Pass\text{Pass} 间接触发运行,因此我们需要为其包装一个转换类 Pass\text{Pass}

/// FuncBBCountPrinter.cpp
#include "ModuleFuncBBPrinter.h"
#include "llvm/Passes/PassBuilder.h"
#include "llvm/Passes/PassPlugin.h"
#include "llvm/IR/PassManager.h"
// 初始化分析 ID
llvm::AnalysisKey FuncBBCountAnalysis::Key;
struct FuncBBCountPrinterPass : public llvm::PassInfoMixin<FuncBBCountPrinterPass> {
llvm::PreservedAnalyses run(llvm::Module &M, llvm::ModuleAnalysisManager &AM) {
// 获取分析结果,间接触发分析 Pass 的调用
auto &Result = AM.getResult<FuncBBCountAnalysis>(M);
return llvm::PreservedAnalyses::all();
}
};

  该转换类 Pass\text{Pass} 只是简单地通过 AnalysisManager\text{AnalysisManager} 获取该自定义分析类 Pass\text{Pass} 的分析结果。当缓存不命中时,就会触发 FuncBBCountAnalysis\text{FuncBBCountAnalysis} 的执行。其实这里可以验证一下:

struct FuncBBCountPrinterPass : public llvm::PassInfoMixin<FuncBBCountPrinterPass> {
llvm::PreservedAnalyses run(llvm::Module &M, llvm::ModuleAnalysisManager &AM) {
// 获取分析结果,间接触发分析 Pass 的调用
llvm::errs() << "First time get result of FuncBBCountAnalysis:\n";
auto &Result = AM.getResult<FuncBBCountAnalysis>(M);
// 再次获取,期望命中缓存,无打印信息输出
llvm::errs() << "Second time get result of FuncBBCountAnalysis:\n";
auto &CachedResult = AM.getResult<FuncBBCountAnalysis>(M);
// 保留所有分析缓存
return llvm::PreservedAnalyses::all();
}
};

  下面就是 Pass\text{Pass} 的注册逻辑了,鉴于篇幅原因便不在此深入。下面给出完整代码:

/// FuncBBCountPrinter.cpp
#include "ModuleFuncBBPrinter.h"
#include "llvm/Passes/PassBuilder.h"
#include "llvm/Passes/PassPlugin.h"
#include "llvm/IR/PassManager.h"
// 初始化分析 ID
llvm::AnalysisKey FuncBBCountAnalysis::Key;
struct FuncBBCountPrinterPass : public llvm::PassInfoMixin<FuncBBCountPrinterPass> {
llvm::PreservedAnalyses run(llvm::Module &M, llvm::ModuleAnalysisManager &AM) {
llvm::errs() << "First time get result of FuncBBCountAnalysis:\n";
auto &Result = AM.getResult<FuncBBCountAnalysis>(M);
// 再次获取,期望命中缓存,无打印信息输出
llvm::errs() << "Second time get result of FuncBBCountAnalysis:\n";
auto &CachedResult = AM.getResult<FuncBBCountAnalysis>(M);
// 保留所有分析缓存
return llvm::PreservedAnalyses::all();
}
};
// 注册分析 Pass 与 转换 Pass
llvm::PassPluginLibraryInfo getFuncBBCountPluginInfo() {
return {
LLVM_PLUGIN_API_VERSION,
"FuncBBCountAnalysis",
LLVM_VERSION_STRING,
[](llvm::PassBuilder &PB) {
// 注册分析 Pass 到 ModuleAnalysisManager
PB.registerAnalysisRegistrationCallback(
[](llvm::ModuleAnalysisManager &MAM) {
MAM.registerPass([] { return FuncBBCountAnalysis(); });
}
);
// 注册可直接调用的转换 Pass 到 ModulePassManager
PB.registerPipelineParsingCallback(
[](llvm::StringRef Name, llvm::ModulePassManager &MPM,
llvm::ArrayRef<llvm::PassBuilder::PipelineElement>) {
// Pass 名称:func-bb-count,命令行调用此名称
if (Name == "func-bb-count") {
MPM.addPass(FuncBBCountPrinterPass());
return true;
}
return false;
}
);
}
};
}
// 插件入口
extern "C" LLVM_ATTRIBUTE_WEAK ::llvm::PassPluginLibraryInfo
llvmGetPassPluginInfo() {
return getFuncBBCountPluginInfo();
}

  CMakeLists.txt\text{CMakeLists.txt} 作参考:

cmake_minimum_required(VERSION 3.18)
project(FuncBBCountAnalysis LANGUAGES C CXX)
set(CMAKE_EXPORT_COMPILE_COMMANDS ON)
find_package(LLVM REQUIRED CONFIG)
message(STATUS "LLVM Version : ${LLVM_PACKAGE_VERSION}")
message(STATUS "LLVM_DIR : ${LLVM_DIR}")
message(STATUS "LLVM Include Dirs : ${LLVM_INCLUDE_DIRS}")
set(CMAKE_CXX_STANDARD 17)
set(CMAKE_CXX_STANDARD_REQUIRED ON)
include_directories(${LLVM_INCLUDE_DIRS})
add_definitions(${LLVM_DEFINITIONS})
add_library(FuncBBCountAnalysis MODULE
ModuleFuncBBPrinter.cpp
)
set_target_properties(FuncBBCountAnalysis PROPERTIES
PREFIX ""
SUFFIX ".so"
COMPILE_FLAGS "-fno-rtti -fPIC"
)
if (EXISTS "${CMAKE_BINARY_DIR}/compile_commands.json")
execute_process(
COMMAND ${CMAKE_COMMAND} -E copy_if_different
${CMAKE_BINARY_DIR}/compile_commands.json
${CMAKE_SOURCE_DIR}/compile_commands.json
)
endif()

  构建、运行参考下面命令:

Terminal window
mkdir build && cd build
cmake -DCMAKE_BUILD_TYPE=[Debug|Release] ..
make -j$(nproc)
cd ..
opt \
-load-pass-plugin=./build/FuncBBCountAnalysis.so \
-passes=func-bb-count \
test.ll \
-o /dev/null

  运行结果: result

如何编写Pass——从LLVM源码角度剖析
https://eiskola.github.io/posts/llvm/cores/write_a_pass/
Author
Eiskola
Published at
2025-12-13
License
CC BY-NC-SA 4.0