使用SSE4.2指令PCMPESTRM配合小模式
Using SSE4.2 instruction PCMPESTRM with small patterns
我试图在字符串匹配算法中使用一些SSE4.2指令,用c++编码。
我不明白如何使用这些说明来匹配较小的图案,希望有人能帮我解决这个问题。
在代码示例中,我试图在打包字符串"I am an antelope"中找到模式"ant"。我希望结果是一个掩码被设置为除索引8处的1以外的所有0。
这是我现在的代码,其中有#include为minmintrinin .h包含sse4.2指令:
void print128_num(__m128i var)
{
uint8_t *val = (uint8_t*) &var;
printf("Text: %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i n",
val[0], val[1], val[2], val[3], val[4], val[5],
val[6], val[7], val[8], val[9], val[10], val[11],
val[12], val[13], val[14], val[15]);
}
int main(){
__m128i s = _mm_set_epi8('e','p','o','l','e','t','n','a',' ','n','a',' ','m','a',' ','i');
__m128i p = _mm_set_epi8(0,0,0,0,0,0,0,0,0,0,0,0,0,'t','n','a');
print128_num(s);
print128_num(p);
__m128i res = _mm_cmpestrm(s, 16, p, 3, 0);
print128_num(res);
return 0;
}
我添加了所有的零,因为初始化函数不允许更少的参数。我意识到这是错误的,但不知道该怎么做,于是绝望地尝试了几次。
无论如何,这是我如何编译的:g++ -g sse4test.cpp -o sse4test -std=c++11 -msse4.2
,这是我的输出:
Text: 105 32 97 109 32 97 110 32 97 110 116 101 108 111 112 101
Text: 97 110 116 0 0 0 0 0 0 0 0 0 0 0 0 0
Text: 7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
我真的不明白。(最后一行)
您的代码有两个问题。首先,在对_mm_cmpestrm
的调用中,您有源和模式。其次,您为最后一个参数指定0
,这是一组指定操作模式的标志。
零模式为_SIDD_CMP_EQUAL_ANY
,描述为For each character c in A, determine whether any character in B is equal to c.
对于子字符串搜索,模式应该指定为_SIDD_UBYTE_OPS | _SIDD_CMP_EQUAL_ORDERED | _SIDD_BIT_MASK
。
如果您做了这些更改,输出是"0 1",或者换句话说,匹配第9个字符。
BTW:你可以通过使用_mm_loadu_si128((__m128i*)(str));
而不是使用_mm_set_epi8
从字符串加载。
相关文章:
- 具有奇怪重复模板模式的派生类中的成员变量已损坏
- 为什么在保护模式下继承升级不起作用
- 如何在全屏模式下(在OpenGL中)使背景透明
- 为什么使用__LINE_的代码在发布模式下在MSVC下编译,而不是在调试模式下
- 派生类是否可以在抽象工厂设计模式中具有数据成员
- 此模式的C++RegEx
- avrogencpp能为模式中的每种类型生成单独的头文件吗
- 使用可变模板的Broadcaster/Listener模式
- c++方法参数只能在linux的发布模式下自行更改
- 资源管理设计模式
- 使用 mod_gsoap 部署服务时,如何在 Gsoap 中更改 soap 上下文的模式?
- C++ 无法在字符数组中使用 for 循环打印字母模式
- 小字符串优化(调试与发布模式)
- 可视化C++:发布模式的运行时库作为'Multi-threaded Debug DLL'
- 如何设计具有不同类型的通知和观察器的观察者模式?
- 在C++的一系列数字中查找重复模式
- 是否允许使用带有"w+"模式的 freopen 进行标准设置?
- C++ 使用存储在动态数组中的文本文件中的数据查找模式
- С++ wxWidgets:代码架构,设计原则和模式
- 使用SSE4.2指令PCMPESTRM配合小模式