字节不符合记忆映射和对文件进行排序
Bytes are unaccounted for after memory-mapping and sorting a file
我有一个由69个字节消息组成的文件。没有EOL字符 - 仅消息后消息。文件中的字节总数正好为11,465,930,307,为(11,465,930,307/69)= 166,172,903消息。
我的程序内存将文件映射到字节数组中,查看每个69字节消息并提取时间戳。我跟踪我在哪个消息号上,然后在RowDetails
对象中使用时间戳和消息编号,该对象以std::vector<RowDetails>
为to_sort
,以便我可以通过时间戳有效地对整个文件进行分类。
std::cout << "Sorting....." << to_sort.size() << " rows..." << std::endl;
std::sort(std::begin(to_sort), std::end(to_sort));
但是,我创建一个已排序的新文件:
unsigned long long total_bytes=0;
unsigned long long total_rows=0;
ofstream a_file("D:\sorted_all");
std::cout << "Outputting " << to_sort.size() << " rows..." << std::endl;
std::cout << "Outputting " << (to_sort.size()*69) << " bytes..." << std::endl;
for(RowDetails rd : to_sort){
for(unsigned long long i = rd.msg_number*69; i<(rd.msg_number*69)+69; i++){
a_file << current_bytes[i];
total_bytes++;
}
total_rows++;
}
std::cout << "Vector rows: "<< total_rows <<std::endl;
std::cout << "Bytes: " << total_bytes <<std::endl;
我的输出:
No. of total bytes (before memory-mapping file): 11,465,930,307 CORRECT
Sorting....... 166,172,903 rows CORRECT
Outputting 166,172,903 rows.... CORRECT
Outputting 11,465,930,307 bytes CORRECT
Vector rows: 166,172,903 CORRECT
Bytes: 11,465,930,169 ERROR, THIS SHOULD BE 307, not 169
我如何处理正确的行数,但是我的计数器,计数总字节是错误的?
查看Windows 7 Explorer中的输出文件时,它说的大小:11,503,248,366字节,即使原始输入文件(我记忆映射)说正确的11,465,930,307。
这只是基于您提供的代码段的猜测,但是我愿意敢打赌, rd.msg_number
是32位类型。rd.msg_number*69
似乎有时可能会溢出其32位结果,从而在内部循环边界中导致错误的计算。我会做以下类似的事情:
for(RowDetails rd : to_sort){
long long msg_offset = (long long)rd.msg_number * 69;
for(unsigned long long i = 0; i < 69; i++){
a_file << current_bytes[msg_offset+i];
total_bytes++;
}
total_rows++;
}
对于不正确的输出文件大小,原因是您的a_file
输出文件是在默认 text 模式下打开的,而不是 binary 模式。在文本模式下,STDIO将进行不需要的EOL转换。因此,将文件打开的语句更改为:
ofstream a_file("d:\sorted_all", ios::out | ios::binary);
相关文章:
- 按价格对文件中的产品进行排序
- 如何对文件中数组中的单个列进行冒泡排序?C++
- 使用C++对一个巨大文件中的文本行进行字典式外部排序
- 如何按升序对输入文件中的数字进行排序,并找到它们的范围和中值
- 如何在一个巨大的文本文件中对整数进行排序
- 在排序链表中插入结构并将其写入二进制文件
- 从文件中读取并将其内容放入对象数组中,然后对它们进行排序
- 对包含整数的文本文件进行排序时,必须逐行进行排序
- 在排序文本文件中实现二叉搜索?
- 如何从输入的文本文件中按姓氏字母顺序对图表进行排序?
- 按文件中列表中行的一部分排序
- C++ 从文件中获取数据时使用 strcpy 和 strcmp 按字母顺序对数组进行排序?
- 如何从文件中读取并按类别对它们进行排序
- 如何在大型文本文件中对数字进行排序
- C++ 从文件中读取字符,计算每个字符并进行排序
- 从文件中读取并按字母顺序排序
- 随机化超大文件内容排序的有效方法是什么?
- 为什么名称在我的数组中重复出现,以及如何使TXT文件排序
- c++二进制文件排序
- 合并两个文本文件排序