如果流读取在特定大小(与文件大小无关)失败

Ifstream read fails at a specific size (unrelated to file size)

本文关键字:文件大小 失败 读取 如果      更新时间:2023-10-16

我试图读取一个文件,我意识到它会失败,因为我将试图读取太多的数据,即使文件比我试图读取的要大得多。

文件是120mb,我的ifstream在12967字节时失败(尽管它在12801开始表现奇怪)。

下面的代码说明了我的问题:

#include <fstream>
#include <iostream>
#include <Windows.h>
using std::ifstream;
using std::cout;
#define CORRECT_SIZE 12800
#define CORRECT_BUT_WIERD 12966
#define INCORRECT_SIZE 12967
bool check_error_bits(ifstream* f);
int main()
{
    ifstream myFile("myfile.txt");
    char c[CORRECT_SIZE];
    char c2[CORRECT_BUT_WIERD];
    char c3[INCORRECT_SIZE];
    /*
     * TEST A (works fine)
    */
    myFile.seekg(0, std::ios_base::beg);
    myFile.read(c, CORRECT_SIZE);
    check_error_bits(&myFile);
    cout << myFile.tellg() << std::endl; // Here, tellg() returns 12800
    /*
     * TEST B (works too, but acts wierd)
     */
    myFile.seekg(0, std::ios_base::beg);
    myFile.read(c2, CORRECT_BUT_WIERD);
    check_error_bits(&myFile);
    cout << myFile.tellg() << std::endl; // Here, tellg() returns 16896
    /*
     * TEST C (FAIL)
    */
    myFile.seekg(0, std::ios_base::beg);
    myFile.read(c3, INCORRECT_SIZE);
    check_error_bits(&myFile);
    cout << myFile.tellg() << std::endl; // Here, tellg() returns -1
    system("pause");
}
bool check_error_bits(ifstream* f)
{
    bool stop = false;
    if (f->eof())
    {
        char msg[500];
        strerror_s(msg, errno);
        cout << "1: " << msg << std::endl;
    }
    if (f->fail())
    {
        char msg[500];
        strerror_s(msg, errno);
        cout << "2: " << msg << std::endl;
        stop = true;
    }
    if (f->bad())
    {
        char msg[500];
        strerror_s(msg, errno);
        cout << "3: " << msg << std::endl;
        stop = true;
    }
    return stop;
}

尝试读取少于12800字节工作得很好。从128001到12966,它可以工作(尽管我没有检查数据是否正确),但是tellg()返回无意义。在12966之后,read失败。

该程序的控制台输出为:

12800
16896
1: No error
2: No error
-1
Press any key to continue . . .

任何帮助将不胜感激!

在Windows环境和文本文件中,值为26=0x1A=^Z的字符被视为"end to file"

因此,如果文件不是以二进制形式打开,即使文件更大,也可能收到意外的eof。

参见维基百科"文件结束"(https://en.wikipedia.org/wiki/End-of-file):

在Microsoft的DOS和Windows(以及CP/M和许多DEC操作系统)中,从终端读取永远不会产生EOF。相反,程序识别源是一个终端(或其他"字符设备"),并将给定的保留字符或序列解释为文件结束指示符;最常见的是ASCII Control-Z,代码26。

您有一个16,896字节的文件。第一次阅读效果很好。第二次读取遇到文件结束,只能读取16,896字节。第三次读取失败,因为您没有清除流上的文件结束标志。

您可能也有一个120MB的文件,但这无关紧要。检查代码中文件的大小。(或者它可能是120MB的二进制数据,但你在文本模式下读取它。)

你写了

(虽然我没有检查数据是否正确)

这样做,因为我认为数据是正确的。

我假设你使用的是windows,所以:为什么资源管理器不能决定文件的大小?

也https://superuser.com/questions/567175/why-is-the-folder-size-in-properties-different-from-the-total-file-folder-size