正在重新投射空指针的容器

Recasting a container of void pointers

本文关键字:空指针 新投射      更新时间:2023-10-16

短版本

我可以从reinterpret_caststd::vector<void*>*再到std::vector<double*>*吗?

其他STL容器呢?

长版本

我有一个函数可以将一个空指针向量重新转换为模板参数指定的数据类型:

template <typename T>
std::vector<T*> recastPtrs(std::vector<void*> const& x) {
std::vector<T*> y(x.size());
std::transform(x.begin(), x.end(), y.begin(),
[](void *a) { return static_cast<T*>(a); } );
return y;
}

但我认为复制矢量内容并不是真正必要的,因为我们实际上只是在重新解释所指向的内容

经过一番修改,我想出了这个:

template <typename T>
std::vector<T*> recastPtrs(std::vector<void*>&& x) {
auto xPtr = reinterpret_cast<std::vector<T*>*>(&x);
return std::vector<T*>(std::move(*xPtr));
}

所以我的问题是:

  • 像这样重新解释整个向量是否安全
  • 如果它是不同类型的容器(如std::liststd::map)呢?要明确的是,我的意思是将std::list<void*>转换为std::list<T*>,而不是在STL容器类型之间转换
  • 我仍在努力理解移动语义。我做得对吗

还有一个后续问题:在没有代码重复的情况下,生成const版本的最佳方法是什么?即定义

std::vector<T const*> recastPtrs(std::vector<void const*> const&);
std::vector<T const*> recastPtrs(std::vector<void const*>&&);

MWE

#include <vector>
#include <algorithm>
#include <iostream>
template <typename T>
std::vector<T*> recastPtrs(std::vector<void*> const& x) {
std::vector<T*> y(x.size());
std::transform(x.begin(), x.end(), y.begin(),
[](void *a) { return static_cast<T*>(a); } );
return y;
}
template <typename T>
std::vector<T*> recastPtrs(std::vector<void*>&& x) {
auto xPtr = reinterpret_cast<std::vector<T*>*>(&x);
return std::vector<T*>(std::move(*xPtr));
}
template <typename T>
void printVectorAddr(std::vector<T> const& vec) {
std::cout<<"  vector object at "<<&vec<<", data()="<<vec.data()<<std::endl;
}
int main(void) {
std::cout<<"Original void pointers"<<std::endl;
std::vector<void*> voidPtrs(100);
printVectorAddr(voidPtrs);
std::cout<<"Elementwise static_cast"<<std::endl;
auto dblPtrs = recastPtrs<double>(voidPtrs);
printVectorAddr(dblPtrs);
std::cout<<"reintepret_cast entire vector, then move ctor"<<std::endl;
auto dblPtrs2 = recastPtrs<double>(std::move(voidPtrs));
printVectorAddr(dblPtrs2);
}

示例输出:

Original void pointers
vector object at 0x7ffe230b1cb0, data()=0x21de030
Elementwise static_cast
vector object at 0x7ffe230b1cd0, data()=0x21de360
reintepret_cast entire vector, then move ctor
vector object at 0x7ffe230b1cf0, data()=0x21de030

请注意,reinterpret_cast版本重用底层数据结构。

以前提出的问题似乎不相关

这些是当我尝试搜索时出现的问题:

interpret_cast A类向量到B类向量

relpret_cast派生类的向量到基类的向量

将一种类型的向量重新解释为同一类型的另一种类型向量

根据严格的混叠规则,答案是一致的否定。但我认为这不适用于我的情况,因为被重铸的向量是一个右值,所以没有混叠的机会。

我为什么要这么做

我正在与一个MATLAB库接口,该库为我提供了void*的数据指针以及一个指示数据类型的变量。我有一个函数可以验证输入并将这些指针收集到向量中:

void parseInputs(int argc, mxArray* inputs[], std::vector<void*> &dataPtrs, mxClassID &numericType);

我无法将此部分模板化,因为直到运行时才知道类型。另一方面,我有数字例程来操作已知数据类型的向量:

template <typename T>
void processData(std::vector<T*> const& dataPtrs);

所以我只是想把一个连接到另一个:

void processData(std::vector<void*>&& voidPtrs, mxClassID numericType) {
switch (numericType) {
case mxDOUBLE_CLASS:
processData(recastPtrs<double>(std::move(voidPtrs)));
break;
case mxSINGLE_CLASS:
processData(recastPtrs<float>(std::move(voidPtrs)));
break;
default:
assert(0 && "Unsupported datatype");
break;
}
}

考虑到您从C库(类似malloc)接收void *的注释,我们似乎可以将问题缩小很多。

特别是,我想你真的在处理一个更像array_view而不是vector的东西。也就是说,您想要的东西可以让您干净地访问一些数据。您可能会更改该集合中的单个项,但永远不会更改整个集合(例如,您不会尝试执行可能需要扩展内存分配的push_back)。

对于这种情况,您可以很容易地创建一个自己的包装器,为您提供对数据的矢量式访问——定义一个iterator类型,具有begin()end()(如果您愿意,还有其他类型,如rbegin()/rend()cbegin()/cend()crbegin()/crend()),以及一个执行范围检查索引的at(),等等

因此,一个相当的最小版本可能看起来像这样:

#pragma once
#include <cstddef>
#include <stdexcept>
#include <cstdlib>
#include <iterator>
template <class T> // note: no allocator, since we don't do allocation
class array_view {
T *data;
std::size_t size_;
public:
array_view(void *data, std::size_t size_) : data(reinterpret_cast<T *>(data)), size_(size_) {}
T &operator[](std::size_t index) { return data[index]; }
T &at(std::size_t index) { 
if (index > size_) throw std::out_of_range("Index out of range");
return data[index];
}

std::size_t size() const { return size_; }
typedef T *iterator;
typedef T const &const_iterator;
typedef T value_type;
typedef T &reference;
iterator begin() { return data; }
iterator end() { return data + size_; }
const_iterator cbegin() { return data; }
const_iterator cend() { return data + size_; }
class reverse_iterator {
T *it;
public:
reverse_iterator(T *it) : it(it) {}
using iterator_category = std::random_access_iterator_tag;
using difference_type = std::ptrdiff_t;
using value_type = T;
using pointer = T *;
using reference = T &;
reverse_iterator &operator++() { 
--it;
return *this;
}
reverse_iterator &operator--() {
++it;
return *this;
}
reverse_iterator operator+(size_t size) const { 
return reverse_iterator(it - size);
}
reverse_iterator operator-(size_t size) const { 
return reverse_iterator(it + size);
}
difference_type operator-(reverse_iterator const &r) const { 
return it - r.it;
}
bool operator==(reverse_iterator const &r) const { return it == r.it; }
bool operator!=(reverse_iterator const &r) const { return it != r.it; }
bool operator<(reverse_iterator const &r) const { return std::less<T*>(r.it, it); }
bool operator>(reverse_iterator const &r) const { return std::less<T*>(it, r.it); }
T &operator *() { return *(it-1); }
};
reverse_iterator rbegin() { return data + size_; }
reverse_iterator rend() { return data; }    
};

我已经尽力展示了如何添加大部分缺失的功能(例如,crbegin()/crend()),但我并没有真正努力地将所有内容都包括在这里,因为剩下的大部分内容比教育内容更重复、更乏味。

这足以在大多数典型的类似矢量的方式中使用array_view。例如:

#include "array_view"
#include <iostream>
#include <iterator>
int main() { 
void *raw = malloc(16 * sizeof(int));
array_view<int> data(raw, 16);
std::cout << "Range based:n";
for (auto & i : data)
i = rand();
for (auto const &i : data)
std::cout << i << 'n';
std::cout << "niterator-based, reverse:n";
auto end = data.rend();
for (auto d = data.rbegin(); d != end; ++d)
std::cout << *d << 'n';
std::cout << "Forward, counted:n"; 
for (int i=0; i<data.size(); i++) {
data[i] += 10;
std::cout << data[i] << 'n';
}
}

请注意,这根本不涉及复制/移动构造,也不涉及销毁。至少正如我所表述的,array_view是对一些现有数据的非拥有视图。在适当的时候销毁数据取决于您(或者至少是array_view之外的东西)。由于我们没有破坏数据,我们可以毫无问题地使用编译器生成的复制和移动构造函数。我们不会因为对指针进行浅层复制而得到双重删除,因为当array_view被销毁时,我们不会进行任何删除。

不,在标准C++中不能做任何类似的事情。

严格的别名规则规定,要访问T类型的对象,必须使用T类型的表达式;除了一个很短的例外列表。

经由void *表达式访问double *不是这样的例外;更不用说每个的向量了。如果您通过右值访问T类型的对象,也不是例外。