这个c++解析器是如何工作的

How does this C++ parser work?

本文关键字:工作 何工作 c++ 这个      更新时间:2023-10-16

我目前正在阅读Bjarne Stroustrup的《Programming: Principles and Practice using c++》,我在理解这种特殊语法是如何实现的方面有问题。

下面是语法和规则:

Expression:
    Term
    Expression "+" Term
    Expression "-" Term
Term:
    Primary
    Term "*" Primary
    Term "/" Primary
    Term "%" Primary
Primary:
    Number
    "(" Expression ")"
Number:
    floating-point literal

但是,Term是这样实现的:

double term()
{
    double left = primary();
    Token t = ts.get();        // get the next token from token stream
    while(true) {
        switch (t.kind) {
        case '*':
            left *= primary();
            t = ts.get();
            break;
        case '/':
        {
            double d = primary();
            if (d == 0) error("divide by zero");
            left /= d;
            t = ts.get();
            break;
        }
        default:
            ts.putback(t);     // put t back into the token stream
            return left;
    }
    }
}

为什么在switch语句中,如果令牌等于"*",我们调用left *= primary();,而不是left *= term() ?

我已经尝试用left *= term()代替left *= primary();(做同样的事情划分)和程序仍然工作得很好。然而,我不理解Bjarne心中的设计决策,也就是说,他为什么要这样实现这个功能。也许我遗漏了什么?

提前感谢!

为什么在switch语句中,如果令牌等于"*",我们调用left *= primary();,而不是left *= term()?

因为语法说:

Term:
    Primary
    Term "*" Primary
    Term "/" Primary
    Term "%" Primary
请注意,如果c++(和C)有一个求幂运算符,或者他的示例语法有一元运算符,您将看到的是更常见的:
Expression:
    Term
    Expression "+" Term
    Expression "-" Term
Term:
    Factor
    Term "*" Factor
    Term "/" Factor
    Term "%" Factor
Factor:
    Primary
    Primary "**" Factor /* note right-associativity */
Primary:
    "+" Primary
    "-" Primary
    Number
    "(" Expression ")"
Number:
    floating-point literal

因为生产不是Term "*" Term

Term "*" Primary

在语法本身中这样做的原因是,如果表达式中有任何嵌套的Term,那么从解析的角度来看,它们被迫"出现"在左侧。有效地说服右边只包含主表达式(不包含其他操作符)。当将此应用于递归解析"程序"时,结果是操作符是左结合的,导致((a*b)*c),而不是(a*(b*c))

这样的语法只会"向下",而不是"向上",否则你最终会陷入一大堆模棱两可的混乱,或者,至少,一种不自然的结合性,让试图用你的语言写算术的人感到困惑。

当然,对于乘法,无论如何,算术结果在概念上是相同的。但是,当您开始使用不同的操作符时,问题就变得清楚了:((a*b)/c)(a/(b*c))不同。