将SSE内部函数转换为可读的C/C++代码
Convert SSE intrinsics to readable C/C++ code?
我继承了一些高度优化(SSE4)但未注释的c代码。是否有任何工具或实用程序可以将SSE内部代码转换为可读性更强的代码或伪代码?这主要是为了可读性,这样我就可以在深入研究和进行更改之前更好地理解代码。
我不知道有这样的工具。
但无论如何,这很可能不会有多大帮助。如果SSE代码优化得很好,那么最困难的部分可能不是解码内部函数。困难的部分是遵循所有技巧来提高局部性并消除迭代内数据依赖性(条带挖掘、多面体循环转换等)
不过,我可以给你一个建议:始终以最简单的方式编写同一例程的注释良好的标量版本。这个"参考代码"应该只关心可读性和正确性,而不是速度。。。因此,它应该有很多断言。还有一个测试套件,可以同时使用标量版本和优化的变体。
无论是第一次实现例程,还是更新现有例程,都要从参考代码和测试套件开始。不一定按这个顺序。
这种方法前期成本更高,但从长远来看要便宜得多。
相关文章:
- C++我的数学有什么问题,为什么我的代码不能正确循环
- 代码在main()中运行,但在函数中出现错误
- 在VS代码中交叉编译Windows与Linux上的MinGW的SDL程序
- 编译包含字符串的代码时遇到问题
- 我在c++代码中生成了一个运行时#3异常
- 如何在linux终端中同时编译和运行c++代码
- 为cl.exe(Visual Studio代码)指定命令行C++版本
- 在Linux for Windows上编译C++代码时出错
- 我的字符计数代码计算错误.为什么
- 孤立代码块在结构中引发异常
- 在编译C++代码(具有dlib和opencv)到WASM时面临问题
- 为什么我的C#代码在调用回C++COM直到Task时会暂停.等待/线程.加入
- 处理小于cpu数据总线的数据类型.(c++转换为机器代码)
- 此代码是否违反一个定义规则
- 为什么我的代码在输出中增加了93天
- 我的简单if-else语句是如何无法访问的代码
- 使用动态分配的数组会导致代码分析发出虚假的C6386缓冲区溢出警告
- 为什么在这个代码结束循环中没有得到结束
- 在c代码之间共享数据的最佳方式
- 这个指针和内存代码打印是什么?我不知道是打印垃圾还是如何打印我需要的值