防止基准测试的空语句优化
Prevent null-statement optimization for benchmark
考虑以下代码:
#include <iostream>
#include <chrono>
#include <cmath>
#include <ctime>
#include <cstdlib>
template <class Counter, class Function, class... Args>
inline double benchmark(const Counter& counter, Function&& f, Args&&... args)
{
const std::chrono::high_resolution_clock::time_point marker
= std::chrono::high_resolution_clock::now();
for (Counter i = Counter(); i < counter; ++i) {
f(args...);
}
return std::chrono::duration_cast<std::chrono::duration<double> >
(std::chrono::high_resolution_clock::now()-marker).count();
}
int main(int argc, char* argv[])
{
srand(time(nullptr));
double y = rand()%10+1;
std::cout<<benchmark(1000000, [](double x){return std::sin(x);}, y)<<"n";
return 0;
}
函数benchmark
测量函数的执行时间。问题是,在优化过程中,函数作为空语句被擦除。是否有办法强制函数真正执行?
编辑:1)我正在寻找一个解决方案在一个标准的c++(没有编译器特定的指令)2)如果f
能够尽可能保持通用(例如void返回类型),那就更好了
我发现这个解决方案使用一个易失性的临时:
#include <iostream>
#include <chrono>
#include <cmath>
template <class Clock = std::chrono::high_resolution_clock, class Counter, class Function, class... Args>
inline double benchmark(const Counter& counter, Function&& f, Args&&... args)
{
volatile decltype(f(args...)) temporary = decltype(f(args...))();
const typename Clock::time_point marker = Clock::now();
for (Counter i = Counter(); i < counter; ++i) {
temporary = f(args...);
}
return std::chrono::duration<double>(Clock::now()-marker).count();
}
int main(int argc, char* argv[])
{
std::cout<<benchmark(1000000000, [](double x){return std::sin(x);}, 3.)<<"n";
return 0;
}
如果您知道如何改进此代码,请注释
既然(匿名)函数返回一个值,为什么不在benchmark
中捕获该值并使用它做一些微不足道的事情,例如将其添加到通过引用传递的值?像这样:
template <class Counter, class Function, class... Args>
inline double benchmark(double& sum, const Counter& counter, Function&& f, Args&&... args)
{
const std::chrono::high_resolution_clock::time_point marker
= std::chrono::high_resolution_clock::now();
for (Counter i = Counter(); i < counter; ++i) {
sum += f(args...);
}
return std::chrono::duration_cast<std::chrono::duration<double> >
(std::chrono::high_resolution_clock::now()-marker).count();
}
我认为编译器现在将很难优化函数调用(假设您打印或以某种方式使用main()
中的总和)。
相关文章:
- 空基优化子对象的地址
- 关闭||运算符优化
- 如何解决gcc编译器优化导致的centos双编译器设置中的分段错误
- 返回值优化:显式移动还是隐式
- 人脸跟踪arduino代码的优化
- 使用仅使用一次的变量调用的复制构造函数.这可能是通过调用move构造函数进行编译器优化的情况吗
- 纯函数,为什么没有优化
- 为什么大多数 pair 实现默认不使用压缩(空基优化)?
- 如何以优化的方式同时迭代两个间距不相等的数组
- 小字符串优化(调试与发布模式)
- 浮点定向舍入和优化
- Visual Studio 调试优化如何工作?
- 为什么开关的优化方式与 c/c++ 中的链接不同?
- 线性优化目标函数中的绝对值
- GCC 会优化内联访问器吗?
- gcc 如何优化此循环?
- 如何防止 CUDA-GDB 中的<优化输出>值
- 为什么我的程序在 O0 和 O2 的优化级别返回不同的结果
- 这个C++编译器优化(在自身的实例上调用对象自己的构造函数)的名称是什么,它是如何工作的?
- 防止基准测试的空语句优化