在C++代码生成器中模拟 C#"new"(隐藏虚拟方法)

Mimicing C# 'new' (hiding a virtual method) in a C++ code generator

本文关键字:隐藏 虚拟 方法 new 代码生成器 模拟 C++      更新时间:2023-10-16

我正在开发一个系统,该系统采用一组已编译的.NET程序集并发出C++代码,然后可以将这些代码编译到任何具有C++编译器的平台上。当然,这涉及到一些广泛的技巧,因为.NET做了很多C++没有做的事情。

其中一种情况是隐藏虚拟方法的能力,例如C#中的以下方法:

class A
{
    virtual void MyMethod()
    { ... }
}
class B : A
{
    override void MyMethod()
    { ... }
}
class C : B
{
    new virtual void MyMethod()
    { ... }
}
class D : C
{
    override void MyMethod()
    { ... }
}

我想出了一个解决方案,看起来很聪明,而且确实有效,比如下面的例子:

namespace impdetails
{
template<class by_type>
struct redef {};
}
struct A
{
    virtual void MyMethod( void );
};
struct B : A
{
    virtual void MyMethod( void );
};
struct C : B
{
    virtual void MyMethod( impdetails::redef<C> );
};
struct D : C
{
    virtual void MyMethod( impdetails::redef<D> );
};

这当然需要C::MyMethodD::MyMethod的所有调用站点构造并传递伪对象,如本例所示:

C *c_d = &d;
c_d->MyMethod( impdetails::redef<C>() );

我不担心这个额外的源代码开销;该系统的输出主要不用于人类消费。

不幸的是,事实证明这实际上会导致运行时开销。直观地说,由于impdetails::redef<>是空的,它将不占用空间,并且传递它将不涉及任何代码。

然而,由于我理解但不完全同意的原因,C++标准要求对象不能为零。这给我们留下了一种情况,编译器实际上会发出代码来创建和传递对象。

事实上,至少在VC2008上,我发现它甚至遇到了将伪字节归零的麻烦,即使在发布版本中也是如此!我不知道为什么是必要的,但这让我更不想这样做。

如果所有其他操作都失败了,我总是可以更改函数的实际名称,比如可能有MyMethodMyMethod$1MyMethod$2。然而,这会导致更多的问题。例如,$在C++标识符中实际上是不合法的(尽管我测试过的编译器会允许它。(输出程序中完全可接受的标识符也可能是输入程序中的标识符,这表明需要一种更复杂的方法,使其不那么有吸引力。

事实证明,在这个项目中还有其他情况,能够使用任意类型参数修改方法签名会很好,类似于我将类型传递给impdetails::redef<>的方式。

有没有其他聪明的方法来解决这个问题,或者我在每个呼叫站点增加开销或篡改名称之间左右为难?

在考虑了系统的一些其他方面(如.NET中的接口(后,我开始认为,也许根本不使用C++虚拟调用机制更好——也许或多或少是必要的。我考虑得越多,使用这种机制就越混乱。

在这种方法中,每个用户对象类都将有一个单独的vtable结构(可能保存在一个像vtabletype::这样的单独命名空间中。生成的类将具有一个指针成员,该指针成员将通过一些技巧初始化,指向vtable的静态实例。虚拟调用将显式使用该vtable的成员指针。

如果操作得当,这应该与编译器自己的实现具有相同的性能。我已经在VC2008上确认了这一点。(相比之下,仅仅使用直C(这是我之前计划的(可能不会执行,因为编译器经常将this优化到寄存器中。(

手动编写这样的代码会很麻烦,但这当然不是生成器关心的问题。这种方法在这个应用程序中确实有一些优势:

  • 因为这是一种更明确的方法,所以可以更确定它正在做.NET指定的关于newslot以及接口实现的选择应该做的事情。

  • 它可能比更传统的C++接口方法更有效(取决于一些内部细节(,后者倾向于调用多重继承。

  • 在.NET中,当对象的.ctor运行时,对象被认为是完全构造的。这会影响虚拟函数的行为方式。有了对vtables的明确了解,这可以通过在分配过程中写入来实现。(尽管将.ctor代码放入正常成员函数是另一种选择。(

  • 在实现反射时,它可能会避免冗余数据。

  • 它提供了更好的对象布局控制和知识,这对垃圾收集器非常有用。

不利的一面是,它完全失去了C++编译器关于vtable条目的重载功能:这些条目是数据成员,而不是函数,因此没有重载。在这种情况下,只对成员进行编号(比如_0_1…(是很诱人的。在调试时,这可能不会太糟糕,因为一旦指针被跟踪,您无论如何都会看到一个实际的、命名正确的成员函数。

我想我最终可能会这样做,但无论如何,我想听听是否有更好的选择,因为这是一个相当复杂的方法(和问题(