将C++数组转储到具有特定endianness的文件中

Dumping a C++ array into a file with a certain endianness

本文关键字:endianness 文件 数组 C++ 转储      更新时间:2023-10-16

我有如下内容:

boost::uint32_t data[ 256 ];
fillMyArray( data );
std::ofstream output( "this.raw", std::ios_base::out | std::ios_base::binary | std::ios_base::trunc );
output.write( reinterpret_cast< char * >( & data ), 256 * 4 );
output.close( );

但是,数组将使用本地端序保存。如何确保它将使用little-endian进行存储?如果更简单的话,我可以使用Boost库。

使用karma::big_wordkarma::little_word可能是一种选择:

在Coliru上查看直播

/a.out && xxd this.raw:输出

0000000: f000 f001 f002 f003 f004 f005 f006 f007  ................
0000010: f008 f009 f00a f00b f00c f00d f00e f00f  ................
0000020: f010 f011 f012 f013 f014 f015 f016 f017  ................
0000030: f018 f019 f01a f01b f01c f01d f01e f01f  ................
0000040: f020 f021 f022 f023 f024 f025 f026 f027  . .!.".#.$.%.&.'
// ...
0000200: 00f0 01f0 02f0 03f0 04f0 05f0 06f0 07f0  ................
0000210: 08f0 09f0 0af0 0bf0 0cf0 0df0 0ef0 0ff0  ................
0000220: 10f0 11f0 12f0 13f0 14f0 15f0 16f0 17f0  ................
0000230: 18f0 19f0 1af0 1bf0 1cf0 1df0 1ef0 1ff0  ................
0000240: 20f0 21f0 22f0 23f0 24f0 25f0 26f0 27f0   .!.".#.$.%.&.'.

完整代码:

#include <boost/spirit/include/karma.hpp>
#include <fstream>
namespace karma = boost::spirit::karma;
template <typename C>
void fillMyArray(C& data) 
{
    std::iota(begin(data), end(data), 0xf000);
}

int main()
{
    std::vector<boost::uint32_t> data(256);
    fillMyArray(data);
    std::ofstream output( "this.raw", std::ios_base::out | std::ios_base::binary | std::ios_base::trunc );
    boost::spirit::karma::ostream_iterator<char> outit(output);
    karma::generate(outit, +karma::big_word,    data);
    karma::generate(outit, +karma::little_word, data);
}

我认为这可以分为三个问题阶段:

  1. 确定系统是小端还是大端。有很多方法可以做到这一点,运行时或编译时(通常,编译时是可以的)
  2. 进行转换(如果需要)
  3. 写入数据

对于1。boost有一个endian.hpp,它为大多数设置提供了这一功能——它定义了BOOST_BIG_ENDIANBOOST_LITTLE_ENDIAN

在2的情况下,在缓冲区上迭代,然后就地复制或转换。大多数编译器都有一个内置的函数来交换数据的字节,MSVC提供_byteswap_ulong,GCC提供__builtin_bswap32。对于其他编译器,请查看各自的文档。

对于第3部分,如果字节交换是"就地"完成的,则不需要更改。如果它是一个副本,那么显然应该将字节交换的数据提供给write

Joachim Pileborg给出了一个很好的答案。您也可以使用std::reverse(),而不是编写自己的函数,如下所述如何从网络管理double的endianes

虽然它不会在一个调用中写入所有数据,但您可以使用例如std::transform来写入值:

std::transform(std::begin(data), std::end(data)
               std::ostream_iterator<uint32_t>(output),
               [](const uint32_t& value) -> uint32_t {
                   return convert_endianess(value);
               });

其中convert_endianess函数是用于进行字节序转换的函数。