无法解析使用boost::spirit::qi的SQL类型
Unable to parse SQL type where condition using boost::spirit::qi
我可能会问一个非常微不足道的问题,但我并没有从我的大脑中得到什么来破解它。尝试解析如下所示的SQL类where子句,使用boost::spirit::qi生成一对向量
std::string input = "book.author_id = '1234' and book.isbn = 'xy99' and book.type = 'abc' and book.lang = 'Eng'"
我已经通过以下线程,但仍然无法做到这一点:-(Thread5 Thread4Thread3Thread2Thread1
[Thread1][6]
[Thread2][7]
[Thread3][8]
[Thread4][9]
[Thread5][10]
我真诚地请求,请帮助我了解如何实现这一目标…也许我没有完全给我的100%,但请善良....
下面是完整的代码(我想做的部分注释),作为第一步,我只是检查我是否可以在Vector中获得所有令牌,然后解析每个Vector元素以生成std::pair的另一个Vector
#include <boost/fusion/adapted.hpp>
#include <boost/spirit/include/qi.hpp>
#include <map>
#include <vector>
namespace qi = boost::spirit::qi;
namespace phx = boost::phoenix;
typedef std::string str_t;
typedef std::pair<str_t, str_t> pair_t;
typedef std::vector<pair_t> pairs_t;
typedef std::vector<str_t> strings_t;
//typedef std::map<std::string, std::string> map_t;
//typedef std::vector<map_t> maps_t;
template <typename It, typename Skipper = qi::space_type>
//struct parser : qi::grammar<It, pairs_t(), Skipper>
struct parser : qi::grammar<It, strings_t(), Skipper>
{
parser() : parser::base_type(start)
{
using namespace qi;
cond = lexeme [ *(char_) ];
conds = *(char_) >> cond % (lit("and"));
//conds = *(char_ - lit("and")) >>(cond % lit("and"));
/*cond = lexeme [ *(char_ - lit("and")) ];
cond = key >> "=" >> value;
key = *(char_ - "=");
value = (''' >> *(~char_(''')) >> ''');
kv_pair = key >> value;*/
start = conds;
//cond = key >> "=" >> value;
//key = *(char_ - "=");
//value = (''' >> *(~char_(''')) >> ''');
// kv_pair = key >> value;
// start = kv_pair;
}
private:
qi::rule<It, str_t(), Skipper> cond;
qi::rule<It, strings_t(), Skipper> conds;
//qi::rule<It, std::string(), Skipper> key, value;//, cond;
//qi::rule<It, pair_t(), Skipper> kv_pair;
//qi::rule<It, pairs_t(), Skipper> start;
qi::rule<It, strings_t(), Skipper> start;
};
template <typename C, typename Skipper>
bool doParse(const C& input, const Skipper& skipper)
{
auto f(std::begin(input)), l(std::end(input));
parser<decltype(f), Skipper> p;
strings_t data;
try
{
bool ok = qi::phrase_parse(f,l,p,skipper,data);
if (ok)
{
std::cout << "parse successn";
std::cout << "No Of Key-Value Pairs= "<<data.size()<<"n";
}
else std::cerr << "parse failed: '" << std::string(f,l) << "'n";
return ok;
}
catch(const qi::expectation_failure<decltype(f)>& e)
{
std::string frag(e.first, e.last);
std::cerr << e.what() << "'" << frag << "'n";
}
return false;
}
int main()
{
std::cout<<"Pair Test n";
const std::string input = "book.author_id = '1234' and book.isbn = 'xy99' and book.type = 'abc' and book.lang = 'Eng'";
bool ok = doParse(input, qi::space);
std::cout<< input <<"n";
return ok? 0 : 255;
}
输出:Pair Test
parse success
No Of Key-Value Pairs= 2
book.author_id = '1234' and book.isbn = 'xy99' and book.type = 'abc' and book.lang = 'Eng'
我期望4…因为有4个条件!!
提前感谢问候,Vivek
一些例子来解决- live on coliru
我很抱歉告诉你,你的语法比你想象的要糟糕得多。
conds = *(char_) // ...
在这里,您基本上只是将所有输入解析为单个字符串,跳过空白。实际上,添加
for (auto& el : data)
std::cout << "'" << el << "'n";
解析后打印:
Pair Test
parse success
No Of Key-Value Pairs= 2
'book.author_id='1234'andbook.isbn='xy99'andbook.type='abc'andbook.lang='Eng''
''
如您所见,第一个元素是*char_
解析的字符串,并且由于conds
和cond
在空输入上匹配,因此您可以免费获得一个空元素。
从基础上慢慢建立你的语法。Spirit是处理测试驱动开发的一个非常好的工具(除了编译时间,但是嘿,你有更多的时间来思考!)。
这是我刚刚编造的一些东西,从第一个构建块开始思考,indent
过滤器,然后我的方式到更高级别的元素:
// lexemes (no skipper)
ident = +char_("a-zA-Z.");
op = no_case [ lit("=") | "<>" | "LIKE" | "IS" ];
nulllit = no_case [ "NULL" ];
and_ = no_case [ "AND" ];
stringlit = "'" >> *~char_("'") >> "'";
// other productions
field = ident;
value = stringlit | nulllit;
condition = field >> op >> value;
conjunction = condition % and_;
start = conjunction;
这些是我认为最简单的东西,可以解析你的语法(有一些创造性的笔记左右,他们似乎不太侵入)。
UPDATE这是我在20分钟内得到的结果:
我总是从映射我希望规则公开的类型开始:
namespace ast
{
enum op { op_equal, op_inequal, op_like, op_is };
struct null { };
typedef boost::variant<null, std::string> value;
struct condition
{
std::string _field;
op _op;
value _value;
};
typedef std::vector<condition> conditions;
}
只有condition
不能"自然"地在Spirit语法中使用而不进行调整:
BOOST_FUSION_ADAPT_STRUCT(ast::condition, (std::string,_field)(ast::op,_op)(ast::value,_value))
现在是语法本身:
// lexemes (no skipper)
ident = +char_("a-zA-Z._");
op_token.add
("=", ast::op_equal)
("<>", ast::op_inequal)
("like", ast::op_like)
("is", ast::op_is);
op = no_case [ op_token ];
nulllit = no_case [ "NULL" >> attr(ast::null()) ];
and_ = no_case [ "AND" ];
stringlit = "'" >> *~char_("'") >> "'";
//// other productions
field = ident;
value = stringlit | nulllit;
condition = field >> op >> value;
whereclause = condition % and_;
start = whereclause;
你可以看到我的原始草图的小偏差,这很有趣:
- 添加
_
到标识符 - 将
op_token
移动到符号匹配器中(因为这样更容易映射枚举值)
看到它所有的生活和工作在Coliru,输出:
Pair Test
parse success
No Of Key-Value Pairs= 4
( [book.author_id] = 1234 )
( [book.isbn] LIKE xy99 )
( [book.type] = abc )
( [book.lang] IS NULL )
book.author_id = '1234' and book.isbn liKE 'xy99' and book.type = 'abc' and book.lang IS null
- 如何在 boost::spirit::qi 中将某些语义操作排除在 AST 之外
- Boost.Spirit.Qi 语法,用于 Boost.Fusion 自适应结构中的默认值
- 我可以在 Boost.Spirit.Qi 中向列表运算符 (%) 提供内存分配提示吗?
- boost::spirit::qi and boost::phoenix::push_back
- Spirit Qi First Parser
- BOOST.SPIRIT.QI:定义太多解析器的组合达到模板实例化限制
- boost::spirit::qi::phrase_parser() into std::map error
- Boost :: Spirit :: Qi语法使用具有不同迭代剂类型的语法
- 用Spirit :: Qi检查加倍的符号
- boost::spirit::qi对输出进行重复解析
- 使用spirit::qi时如何忽略来自spirit::lex的令牌属性
- Spirit Qi用简单的C风格结构化输入解析问题
- boost :: Spirit :: Qi-与语法结构中的实例成员一起工作
- Boost::Spirit::QI解析器:已解析元素的索引
- 用boost::spirit::qi解析替身列表
- 使用boost::spirit::qi来解析带有分隔符的数字
- 在Boost Spirit Qi中,我如何将每个字符匹配到下一个空格(带有预跳过)
- 通过使用boost spirit qi解析器迭代填充BGL图
- 将 boost::spirit::qi::p hrase_parse() 与 qi::grammar 一起使用时出错
- boost::spirit: qi::rule 或包含 qi::rule 作为解析结果的结构