紧凑向量一个小的内存足迹向量

compact vector a small memory foot print vector

本文关键字:向量 内存 一个 足迹      更新时间:2023-10-16

我维护一个旧的C++应用程序,它有很多类,如下所示:

    class ClassWithALotOfVectors
    {
        std::vector<int> _vector1;
        std::vector<int> _vector2;
        // a lot of other vector datamembers go here
        std::vector<double> _vectorN;
    };

也就是说,成员为double或int向量的数据类型。问题是,这些矢量永远不会同时填充,因此当我们创建100000个ClassWithALotOfVectors实例时,内存使用量加起来尽管只有10%的矢量在使用,但这一数字还是令人印象深刻。

所以我决定写一个小的"按需分配"向量类。

它是一个围绕std::vector的包装器,其中内部vector仅在第一次访问(使用两个getter-ref()&const_ref()方法)

当我用compact_vector替换ClassWithALotOfVectors类中的std::vector时如下所示:

    class ClassWithALotOfVectors2
    {
    compact_vector<int> _vector1;
    compact_vector<int> _vector2;
    compact_vector<double> _vectorN;
    };

做了一些测试,结果很有希望——内存使用率下降了戏剧性地,但突然发现应用程序不释放内存最后,内存消耗的增长速度要慢得多过去是,但应用程序似乎没有释放内存最后。

你能看看我对compact_vector的实现吗看看你是否能发现内存管理的问题。

    template <class T> class compact_vector 
    { 
    public: 
            compact_vector<T>()
            :_data(NULL) 
            { 
            } 
            ~compact_vector<T>() 
            { 
                    clear(); 
            } 
            compact_vector<T>(const compact_vector<T> & rhs) 
            :_data(NULL) 
            { 
                    if (NULL != rhs._data) 
                    { 
                            _data = new std::vector<T>(*(rhs._data)); 
                    } 
                    else 
                    { 
                            clear(); 
                    } 
            } 
            //      assignment 
            // 
            compact_vector<T> & operator=(const compact_vector<T> & rhs) 
            { 
                    if (this != &rhs) 
                    { 
                            clear(); 
                            if (NULL != rhs._data) 
                            { 
                                    _data = new std::vector<T>(*rhs._data); 
                            } 
                    } 
                    return *this; 
            } 
            compact_vector<T> & operator=(const std::vector<T> & rhs) 
            { 
                    clear(); 
                    if (!rhs.empty()) 
                    { 
                            _data = new std::vector<T>(rhs); 
                    } 
                    return *this; 
            } 
            const std::vector<T> & const_ref() 
            { 
                    createInternal(); 
                    return *_data; 
            } 
            std::vector<T> & ref() 
            { 
                    createInternal(); 
                    return *_data; 
            } 
            void    clear() 
            { 
                    if (NULL != _data) 
                    { 
                            _data->clear(); 
                            delete _data; 
                            _data = NULL; 
                    } 
            } 
    private: 
            void    createInternal() 
            { 
                    if (NULL == _data) 
                    { 
                            _data = new std::vector<T>(); 
                    } 
            } 
    private: 
            compact_vector<T>(const std::vector<T> & rhs) 
            { 
            } 
            compact_vector<T>(std::vector<T> & rhs) 
            { 
            } 
            compact_vector<T>(std::vector<T> rhs) 
            { 
            } 
            std::vector<T> * _data; 
    }; 

std::vector的大多数实现在需要内存之前都不会获取内存,并且向量的大小通常只有几个(3+个可能额外的调试信息)指针。也就是说,std::vector<int>()不会为任何对象分配空间。我相信你是找错树了。

为什么您的原始代码具有更高的内存使用率?您希望clear()释放内存吗?

如果是这样,你就错了。clear()函数破坏所包含的元素,但不释放所分配的内存。考虑添加一个包装器来清除使用以下习惯用法的内存:

std::vector<int>().swap( _data );

前一行所做的是创建一个新的向量(通常没有附加内存,不是强制的,而是通用的实现),并交换这两个向量的内容。在表达式的末尾,临时包含最初由_data向量保存的数据,而_data为空且没有内存(定义了实现)。临时在完整表达式结束时被销毁,内存被释放。

或者,如果编译器支持C++11,则可以在调用clear()之后使用shrink_to_fit()。该标准并不要求shrink_to_fit()实际收缩以适应,但对于空向量,我希望实现能够做到这一点。在调用后调用capacity()来测试它,看看它是否已降到0。

使用智能指针。在这种情况下,std::unique_ptr带有手工复制ctor/赋值运算符。突然间,你所有的问题都解决了。这就像魔术!

很抱歉听起来这么刻薄,但内存泄漏总是有相同的答案:智能指针

既然你说它是一个旧的应用程序,不能用它做太多事情。那么在构建过程中保留所有大小为零的向量怎么样
这很乏味,但由于旧的应用程序,预计不会有太多修改。也许这一次值得付出。

class ClassWithALotOfVectors    
{    
   std::vector<int> _vector1;     
   std::vector<int> _vector2;        
   // a lot of other vector datamembers go here         
   std::vector<double> _vectorN;
  public:
     ClassWithALotOfVectors() : Init() { }   
     void Init()   
     {   
         vector1.reserve(0);   
         /// Like wise other vectors.   
     }  
};

一次只使用一个向量的想法听起来像union的概念。毫无疑问,C++有一个名为anonymous union的元素,它正是这样做的。

class ClassWithALotOfVectors {
    public:
    union  {
        std::vector<double> _vector1;
        std::vector<double> _vector2;
    };
    ClassWithALotOfVectors() { new(&_vector1) std::vector<double>; };
    ~ClassWithALotOfVectors() { _vector1.~vector<double>(); };
};

因为并集不知道该调用哪个元素的构造函数,所以默认构造函数在并集中被禁用,您必须手动构造和解构并集的元素,但我认为这将实现您想要的,将_vector1_vector2别名为同一元素,但将两者都放在ClassWithALotOfVectors命名空间中,然后在调用CCD_ 17的析构函数时解除分配向量。

有关匿名工会的更多信息,请参阅:CPP参考:匿名工会