统计功能 :没有这样的文件或目录错误

stat function : no such file or directory error

本文关键字:文件 错误 功能 统计      更新时间:2023-10-16

当我的程序尝试stat()包含特定 UTF-8 字符的文件时,stat()函数返回错误。例如,我可以使用 vi /tmp/surgateDlpMgQure/Özkul Gazete打开文件,但将同一文件传递给 stat()会产生错误。系统区域设置包括:

郎=en_US。UTF-8

LC_CTYPE="en_US。UTF-8"

LC_COLLATE=C

LC_TIME="en_US。UTF-8"

LC_NUMERIC="en_US。UTF-8"

LC_MONETARY="en_US。UTF-8"

LC_MESSAGES="en_US。UTF-8"

LC_ALL=

我应该做点什么才能让stat()理解 UTF-8 字符吗?

这是代码:

int main ()
{
    struct stat s;
    if (stat("/tmp/surgateDlpMgQure/Özkul Gazete", &s) == -1)
            perror("stat");

    switch (s.st_mode & S_IFMT) {
            case S_IFBLK:  printf("block devicen");            break;
            case S_IFCHR:  printf("character devicen");        break;
            case S_IFDIR:  printf("directoryn");               break;
            case S_IFIFO:  printf("FIFO/pipen");               break;
            case S_IFLNK:  printf("symlinkn");                 break;
            case S_IFREG:  printf("regular filen");            break;
            case S_IFSOCK: printf("socketn");                  break;
            default:       printf("unknown?n");                break;
    }
 return 0;
}

问题可能是文件名的编码不是与您在程序内部使用的编码相同。 关键这里的问题是谁创建了文件(并赋予了它这个名字),以及代码中的字符串来自何处。 大多数 Unix 与关于编码,只要几个特殊字符,比如 '/',具有预期的编码。 因此,独立于您的当前区域设置,文件名可以是拉丁语-1、拉丁语-5(只是猜测,但名称看起来是土耳其语)或 UTF-8。 Unix中几乎没有任何东西在乎,但是您必须确保在程序中使用相同的编码用于创建文件,否则名称将不匹配。 (在实践中,我发现最简单的策略是限制字符文件名为非常小的集合:ASCII 字母数字字符、数字、 '_',可能'-'

如果不确定磁盘上文件名的实际编码,您可以使用ls | od -t x1 -tc找出其中的字节。 如果您的Ö是0xD6,则编码为拉丁语-1或拉丁语-5(可能不会有太大区别),以及您必须确保您传递的文件名stat(或open,或任何其他采用文件名的函数)都编码在其中一个中编码。 相反,如果您有两个字节序列0xC3,0x96,则文件名为 UTF-8。

如果您确实要支持 ASCII 子集之外的字符,则我强烈建议您确保所有文件名都经过编码在 UTF-8 中。 假设你可以 - 编码将由创建文件的程序,如果它不是您的程序(或者如果您正在从其他系统接收文件),您可能无法做任何事情。 在最坏的情况下,您甚至可能不得不使用opendirreaddir某种匹配算法来查找实际文件名(无论采用何种编码),并使用它。

我认为由于该文件名名称中的空格而存在问题...

您可以尝试更改没有空格的文件名吗

Özkul Gazete  -> Özkul_Gazete

linux 上,通常我不在文件名或目录名称中使用空格

破解它的简单方法:

使用该 Unicode 字符的转义表示形式:

"/tmp/surgateDlpMgQure/x00xF6zkul Gazete"

我没有测试,但它会起作用。虽然这不是在 C 中使用 unicode 字符串的方法。

奇怪的是,你的代码适用于我的系统,但不适用于我的:)