是正则是查看字符串是否是另一个弦的好方法

Is regex a good way to see if a string is a substring of another?

本文关键字:方法 另一个 字符串 是否是      更新时间:2023-10-16

假设我有一个固定的字符串列表。

对于任何输入字符串,我想找出列表中的哪个字符串是输入字符串的子字符串,或者列表中没有这样的字符串。

我这样做的方法是:对于列表中的每个字符串,将其作为模式并使用正则匹配,以查看它是否与某处的输入字符串匹配。

正在使用正则高速公路方法?

谢谢。

它在C 中。该计划是使用C 标准库或Boost库。

绝对过度杀伤。REGEX需要编译构造模式,您只是在持续的子字符串进行线性搜索。标准lib具有您的需求:http://www.cplusplus.com/reference/string/string/string/find/

一般而言,否,以下是在字符串中查找固定子字符串的好方法。

有几种用于子字符串搜索的算法比逐字节搜索更快。其中最受欢迎的是Boyer-Moore。该网站列出了大多数知名的网站,包括Boyer-Moore及其变化:http://www-igm.univ-mlv.fr/~lecroq/string/index.html。

但是,大多数正则发动机实际上在内部使用Boyer-Moore来提高性能(Regex引擎之间的竞争实际上是一回事)。因此,在某些情况下,Regexp 做到这一点的好方法。

但是。由于您提到了您使用的boost,因此您应该能够直接使用Boost的boyer_moore_search()而无需求助于正则是Regex。

确实要注意,如果您的搜索字符串很小,则Boyer-Moore效率低下。还有其他算法将其用于小型搜索字符串。因此,您可能需要进行一些研究,并将算法与您自己的典型搜索字符串进行比较。但总的来说,博耶·莫尔(Boyer-Moore)是一个不错的选择。

相关文章: