如何在cpp中为所有语言的全词匹配构建正则表达式
How to build a regex for a whole word match for all languages in cpp?
用于单词边界的b
正则表达式是否适用于所有语言的cpp?还是只是拉丁字母?
如果不是-如何匹配一个完整的单词,如"?
具体来说,我想到了类似于[^s]תפוח[$s]
的东西,但不确定^
是否被插入为否定或字符串的开头。。。
我正在使用PCRE库。
您没有说明您使用的正则表达式引擎。但无论如何,您可能会考虑使用boost regex,因为它有一个包装器,可以与ICU库一起使用来处理unicode。
文件显示您可以:
创建支持各种Unicode数据的正则表达式属性,包括字符分类。
这意味着/b和/b应该使用ICU支持的任何编码。
在Unicode合规性的"标准"部分,它说:
1.4简单的单词边界:一致:单词字符集中包含无间距标记。
相关文章:
- 使用正则表达式regex_search在字符串中查找字符串
- 在 C++ 中使用正则表达式错误时出现问题 括号表达式中的范围无效
- C++正则表达式无限循环
- FindPackageHandleStandardArgs.cmake:137 的 CMake 错误(消息):找不到 Boost (缺少:正则表达式)(找到合适的版本"1.72.0",
- 定义有趣的宏和正则表达式在Z3 C++绑定
- 带有多个字符分隔符的正则表达式
- C++ 使用增强正则表达式库时断言崩溃
- 有人可以帮助我处理正则表达式吗?
- 使用正则表达式获取大括号块的列表
- 正则表达式以匹配数字的重复模式,后跟任何类型的分隔符?
- 组合正则表达式部分使用 | 不起作用的 C++
- 为什么C++正则表达式这么慢?
- 如何使HTML5电子邮件验证正则表达式在C++中工作?
- 在C++中实现正则表达式
- C++正则表达式替换整个单词
- 用C++编写正则表达式的正确方法是什么?
- 如何从Stroustrup的C++书中解释这个正则表达式?
- 如何从字符串变量为正则表达式构建原始字符串
- 需要帮助构建正则表达式模式
- 如何在cpp中为所有语言的全词匹配构建正则表达式