优化栈遍历性能

Optimizing Stack-Walking performance

本文关键字：性能遍历优化更新时间：2023-10-16

目前我使用dbghelp库来遍历一些进程线程的堆栈(使用GetThreadContext()和StackWalk64())并仅收集每个帧包含的返回地址。

然而，这样做的开销对于系统需求来说太大了——每次堆栈遍历的总时间是apx. 5毫秒(10-15帧)。这一次包括GetThreadContext()和调用StackWalk64()来获取所有帧的循环。

无论如何，我必须找到一种更快的方法来做这件事。有人知道怎么做吗?

编辑:

有谁知道ETW (Windows事件跟踪)机制吗?

如果是，我如何跟踪在一段时间内发生的所有上下文切换?是否存在在每个上下文切换上发布事件的事件提供程序?

我能想到的最快的方法是通过创建一个内核驱动程序来创建您自己的GetThreadContext和StackWalk64版本，该内核驱动程序捕获您试图监视的线程的ETHREAD结构的kernelStack字段。这里有一篇关于这个主题的好文章。

如果你使用的是Windows Vista或更高版本，你应该使用ETW，句号。您可以激活所有您正在谈论的内容，包括上下文切换和样本配置文件事件，而且它非常有效。对于X86，它基本上是遍历EBP寄存器链，这是它需要遍历的地址链表。在64位领域，堆栈行走器必须展开堆栈，因此它的效率有点低，但我可以告诉您，如果您在应用程序中执行任何合理数量的工作，堆栈行走的影响就不会显示出来。当然不是毫秒级的

ETW部分实际上是一个独立的问题。Windows性能分析工具可以捕获所有上下文切换，以及Visual Studio Profiler在"资源争用并发分析"模式下。您还可以使用logman手动将所有事件转储到文件中，请参阅此处的说明。