'Freezing'表达式

'Freezing' an expression

本文关键字:表达式 Freezing      更新时间:2023-10-16

我有一个C++表达式,我希望"冻结"。我的意思是我有如下语法:

take x*x with x in container ...

其中...指示进一步(对此问题无用)语法。但是,如果我尝试编译它,无论我使用什么预处理器翻译来使"take"成为"运算符"(在倒逗号中,因为它在技术上不是运算符,但翻译阶段将其变成一个类,例如,运算符*可用),编译器仍然尝试评估/计算 x*x 来自哪里, (而且,由于它以前没有被声明(因为它在"in"阶段进一步声明),它反而)找不到它并抛出编译错误。

我目前的想法本质上是尝试将表达式放在 lambda 中(并且由于我们可以推断容器的类型,因此我们可以将具有正确类型的x声明为,例如,[](decltype(*begin(container)) x) { return x*x } - 因此,当编译器查看此语句时,它是有效的并且不会抛出任何错误),但是,我遇到了实际实现此目标的错误。

因此,我的问题是:有没有办法/最好的方法是什么来"冻结"我表情的x*x部分?

编辑:为了澄清我的问题,请采取以下措施。假设运算符 - 以理智的方式定义,以便以下尝试实现上述take ...语法的作用:

MyTakeClass() - x*x - MyWithClass() - x - MyInClass() - container ...

当编译此语句时,编译器将抛出一个错误;x没有声明,所以x*x没有意义(x-MyInClass()等也没有意义)。我试图实现的是找到一种方法来编译上述表达式,使用任何可用的巫毒魔法,而无需事先知道x的类型(或者,事实上,它将被命名为x;它可以被命名为"somestupidvariablename")。

我提出了

一个基于表达式模板的几乎解决方案(注意:这些不是表达式模板,它们基于表达式模板)。 不幸的是,我无法想出一种不需要您预先声明x的方法,但我确实想出了一种延迟类型的方法,因此您只需全局声明x一个,并且可以在同一程序/文件/范围内一遍又一遍地将其用于不同类型的类型。 这是使用魔法的表达式类型,我将其设计得非常灵活,您应该能够随意轻松地添加操作和使用。 它的使用方式与您描述的完全一样,除了 x 的预先声明。

我知道的缺点:它确实需要T*TT+TT(long)可编译的。

expression x(0, true); //x will be the 0th parameter.  Sorry: required :(
int main() {
    std::vector<int> container;
    container.push_back(-3);
    container.push_back(0);
    container.push_back(7);
    take x*x with x in container; //here's the magic line
    for(unsigned i=0; i<container.size(); ++i)
        std::cout << container[i] << ' ';
    std::cout << 'n';
    std::vector<float> container2;
    container2.push_back(-2.3);
    container2.push_back(0);
    container2.push_back(7.1);
    take 1+x with x in container2; //here's the magic line
    for(unsigned i=0; i<container2.size(); ++i)
        std::cout << container2[i] << ' ';
    return 0;
}

这是使它正常工作的类和定义:

class expression {
    //addition and constants are unused, and merely shown for extendibility
    enum exprtype{parameter_type, constant_type, multiplication_type, addition_type} type;
    long long value; //for value types, and parameter number
    std::unique_ptr<expression> left; //for unary and binary functions
    std::unique_ptr<expression> right; //for binary functions
   
public:
    //constructors
    expression(long long val, bool is_variable=false) 
    :type(is_variable?parameter_type:constant_type), value(val)
    {}
    expression(const expression& rhs) 
    : type(rhs.type)
    , value(rhs.value)
    , left(rhs.left.get() ? std::unique_ptr<expression>(new expression(*rhs.left)) : std::unique_ptr<expression>(NULL))
    , right(rhs.right.get() ? std::unique_ptr<expression>(new expression(*rhs.right)) : std::unique_ptr<expression>(NULL))
    {}
    expression(expression&& rhs) 
    :type(rhs.type), value(rhs.value), left(std::move(rhs.left)), right(std::move(rhs.right)) 
    {}
    //assignment operator
    expression& operator=(expression rhs) {
       type = rhs.type;
       value = rhs.value;
       left = std::move(rhs.left);
       right = std::move(rhs.right);
       return *this;
    } 
 
    //operators
    friend expression operator*(expression lhs, expression rhs) {
        expression ret(0);
        ret.type = multiplication_type;
        ret.left = std::unique_ptr<expression>(new expression(std::move(lhs)));
        ret.right = std::unique_ptr<expression>(new expression(std::move(rhs)));
        return ret;
    }
    friend expression operator+(expression lhs, expression rhs) {
        expression ret(0);
        ret.type = addition_type;
        ret.left = std::unique_ptr<expression>(new expression(std::move(lhs)));
        ret.right = std::unique_ptr<expression>(new expression(std::move(rhs)));
        return ret;
    }
    
    //skip the parameter list, don't care.  Ignore it entirely
    expression& operator<<(const expression&) {return *this;}
    expression& operator,(const expression&) {return *this;}
    template<class container>    
    void operator>>(container& rhs) {
        for(auto it=rhs.begin(); it!=rhs.end(); ++it)
            *it = execute(*it);
    }  
private: 
    //execution
    template<class T>
    T execute(const T& p0) {
       switch(type) {
       case parameter_type :
           switch(value) {
           case 0: return p0; //only one variable
           default: throw std::runtime_error("Invalid parameter ID");
           }
       case constant_type:
           return ((T)(value));
       case multiplication_type:
           return left->execute(p0) * right->execute(p0);
       case addition_type:
           return left->execute(p0) + right->execute(p0);
       default: 
           throw std::runtime_error("Invalid expression type");
       }
    }
    //This is also unused, and merely shown as extrapolation
    template<class T>
    T execute(const T& p0, const T& p1) {
       switch(type) {
       case parameter_type :
           switch(value) {
           case 0: return p0;
           case 1: return p1; //this version has two variables
           default: throw std::runtime_error("Invalid parameter ID");
           }
       case constant_type:
           return value;
       case multiplication_type:
           return left->execute(p0, p1) * right->execute(p0, p1);
       case addition_type:
           return left->execute(p0, p1) + right->execute(p0, p1);
       default: 
           throw std::runtime_error("Invalid expression type");
       }
    }
}; 
#define take 
#define with <<
#define in >>
  

在 http://ideone.com/Dnb50 以正确的输出进行编译和运行

您可能会注意到,由于必须预先声明x,因此完全忽略with部分。 这里几乎没有宏魔法,宏有效地将其变成"x*x >> x << container",>>x完全不做任何事情。 所以表达实际上是"x*x << container"。

另请注意,此方法很慢,因为这是一个解释器,几乎所有的减速都意味着。 但是,它的好处是它是可序列化的,您可以将函数保存到文件中,稍后加载它,然后执行它。

R.MartinhoFernandes观察到,x的定义可以简化为仅仅是expression x;,并且可以从with部分推导出参数的顺序,但它需要对设计进行大量重新思考,并且会更加复杂。 我可能会稍后回来添加该功能,但与此同时,要知道这绝对是可能的。


如果您可以将表达式修改为"take(x*x with x in container)",那么这将消除预先声明"x"的需要,其内容比表达式模板简单得多。 #define , #define 中 , #define take(expr, var, con) \ std::transform(con.begin(), con.end(), con.begin(), \ [](const typename con::value_type& var) -> typename con::value_type \ {return expr;});
int main() {
    std::vector<int> container;
    container.push_back(-3);
    container.push_back(0);
    container.push_back(7);
    take(x*x with x in container); //here's the magic line
    for(unsigned i=0; i<container.size(); ++i)
        std::cout << container[i] << ' ';
}

我做了一个与我之前的答案非常相似的答案,但使用实际的表达式模板,这应该要快得多。 不幸的是,MSVC10 在尝试编译时崩溃,但 MSVC11、GCC 4.7.0 和 Clang 3.2 都可以编译并运行它。 (所有其他版本未经测试)

以下是模板的用法。 实现代码在这里。

#define take 
#define with ,
#define in >>= 
//function call for containers 
template<class lhsexpr, class container>
lhsexpr operator>>=(lhsexpr lhs, container& rhs)
{
    for(auto it=rhs.begin(); it!=rhs.end(); ++it)
        *it = lhs(*it);
    return lhs;
}
int main() {
    std::vector<int> container0;
    container0.push_back(-4);
    container0.push_back(0);
    container0.push_back(3);
    take x*x with x in container0; //here's the magic line
    for(auto it=container0.begin(); it!=container0.end(); ++it)
        std::cout << *it << ' ';
    std::cout << 'n';
    auto a = x+x*x+'a'*x;
    auto b = a; //make sure copies work
    b in container0;
    b in container1;
    std::cout << sizeof(b);
    return 0;
}

如您所见,这与我以前的代码完全相同,只是现在所有函数都是在编译时决定的,这意味着这将具有与lambda完全相同的速度。 事实上,C++11 lambda 之前有 boost::lambda 个,它适用于非常相似的概念。

这是一个单独的答案,因为代码大不相同,而且更加复杂/令人生畏。 这也是为什么实现不在答案本身中的原因。

我认为不可能

使用预处理器获得这种"列表理解"(不完全是,但它正在做同样的事情)ala Haskell。预处理器只是执行简单的搜索并替换为参数的可能性,因此它不能执行任意替换。特别是改变表达部分的顺序是不可能的。

我看不到在不更改顺序的情况下执行此操作的方法,因为您总是需要以某种方式出现在x*x之前x来定义此变量。使用 lambda 无济于事,因为您仍然需要在x*x部分前面x,即使它只是一个参数。这使得此语法不可行。

有一些方法可以解决这个问题:

  • 使用不同的预处理器。有基于 Lisp-macros 思想的预处理器,它可以成为语法感知的,因此可以将一个语法树任意转换为另一个语法树。一个例子是为OCaml语言开发的Camlp4/Camlp5。有一些非常好的教程关于如何使用它进行任意语法转换。我曾经有一个关于如何使用Camlp4将makefile转换为C代码的解释,但是我再也找不到了。还有一些关于如何做这些事情的其他教程。

  • 稍微更改语法。这种列表理解在语义上只是对Monad用法的语法简化。随着C++11的到来,Monads在C++成为可能。然而,句法糖可能不是。如果你决定将你试图做的事情包装在Monad中,很多事情仍然是可能的,你只需要稍微改变语法。不过,在C++中实现Monads一点也不有趣(尽管我最初期望并非如此)。看看这里一些例子,如何让Monads进入C++。

最好的方法是使用预处理器解析它。我确实相信预处理器可以成为构建EDSL(嵌入式域特定语言)的非常强大的工具,但您必须首先了解预处理器解析事物的局限性。预处理器只能解析出预定义的令牌。因此,语法必须通过在表达式周围放置括号来稍微更改,并且还必须用FREEZE宏包围它(我刚刚选择了 FREEZE,它可以被称为任何东西):

FREEZE(take(x*x) with(x, container))

使用此语法,您可以将其转换为预处理器序列(当然,使用 Boost.Preprocessor 库)。一旦你把它作为一个预处理器序列,你可以对它应用很多算法来转换它,按照你喜欢的方式。Linq 库 for C++ 也采用了类似的方法,您可以在其中编写以下内容:

LINQ(from(x, numbers) where(x > 2) select(x * x))
现在,要

首先转换为 pp 序列,您需要定义要解析的关键字,如下所示:

#define KEYWORD(x) BOOST_PP_CAT(KEYWORD_, x)
#define KEYWORD_take (take)
#define KEYWORD_with (with)

因此,当您调用KEYWORD(take(x*x) with(x, container))时,它将扩展到 (take)(x*x) with(x, container) ,这是将其转换为 pp 序列的第一步。现在为了继续前进,我们需要使用 Boost.Preprocessor 库中的 while 构造,但首先我们需要定义一些小宏来帮助我们:

// Detects if the first token is parenthesis
#define IS_PAREN(x) IS_PAREN_CHECK(IS_PAREN_PROBE x)
#define IS_PAREN_CHECK(...) IS_PAREN_CHECK_N(__VA_ARGS__,0)
#define IS_PAREN_PROBE(...) ~, 1,
#define IS_PAREN_CHECK_N(x, n, ...) n
// Detect if the parameter is empty, works even if parenthesis are given
#define IS_EMPTY(x) BOOST_PP_CAT(IS_EMPTY_, IS_PAREN(x))(x)
#define IS_EMPTY_0(x) BOOST_PP_IS_EMPTY(x)
#define IS_EMPTY_1(x) 0 
// Retrieves the first element of the sequence
// Example:
// HEAD((1)(2)(3)) // Expands to (1)
#define HEAD(x) PICK_HEAD(MARK x)
#define MARK(...) (__VA_ARGS__),
#define PICK_HEAD(...) PICK_HEAD_I(__VA_ARGS__,)
#define PICK_HEAD_I(x, ...) x
// Retrieves the tail of the sequence
// Example:
// TAIL((1)(2)(3)) // Expands to (2)(3)
#define TAIL(x) EAT x
#define EAT(...)

这样可以更好地检测括号和空。它提供了一个HEADTAIL宏,其工作方式与BOOST_PP_SEQ_HEAD略有不同。(Boost.Preprocessor 无法处理具有变量参数的序列)。现在,我们如何定义一个使用 while 构造的 TO_SEQ 宏:

#define TO_SEQ(x) TO_SEQ_WHILE_M 
( 
BOOST_PP_WHILE(TO_SEQ_WHILE_P, TO_SEQ_WHILE_O, (,x)) 
)
#define TO_SEQ_WHILE_P(r, state) TO_SEQ_P state
#define TO_SEQ_WHILE_O(r, state) TO_SEQ_O state
#define TO_SEQ_WHILE_M(state) TO_SEQ_M state
#define TO_SEQ_P(prev, tail) BOOST_PP_NOT(IS_EMPTY(tail))
#define TO_SEQ_O(prev, tail) 
BOOST_PP_IF(IS_PAREN(tail), 
TO_SEQ_PAREN, 
TO_SEQ_KEYWORD 
)(prev, tail)
#define TO_SEQ_PAREN(prev, tail) 
(prev (HEAD(tail)), TAIL(tail))
#define TO_SEQ_KEYWORD(prev, tail) 
TO_SEQ_REPLACE(prev, KEYWORD(tail))
#define TO_SEQ_REPLACE(prev, tail) 
(prev HEAD(tail), TAIL(tail))
#define TO_SEQ_M(prev, tail) prev

现在,当您调用TO_SEQ(take(x*x) with(x, container))时,您应该得到一个序列(take)((x*x))(with)((x, container))

现在,这个序列更容易使用(因为 Boost.Preprocessor 库)。您现在可以反转它、转换它、过滤它、折叠它等。这是非常强大的,并且比将它们定义为宏要灵活得多。例如,在 Linq 库中,查询from(x, numbers) where(x > 2) select(x * x)转换为以下宏:

LINQ_WHERE(x, numbers)(x > 2) LINQ_SELECT(x, numbers)(x * x)

然后,这些宏将生成用于列表理解的 lambda,但是当它生成 lambda 时,它们还有更多工作要做。同样的事情也可以在您的库中完成,take(x*x) with(x, container)可以转换为以下内容:

FREEZE_TAKE(x, container, x*x)

另外,您没有定义像take这样入侵全局空间的宏。

注意:此处的这些宏需要 C99 预处理器,因此在 MSVC 中不起作用。(不过有解决方法)