使用中文字符时文件名错误

Wrong filename when using chinese characters

本文关键字:文件名 错误 字符 中文      更新时间:2023-10-16

我正在尝试使用中文字符在Windows上创建一个文件。整个路径都在变量"std::string originalPath"内,但是,我有一个字符集问题,我根本无法理解来克服。

我编写了以下代码:

#include <iostream>
#include <boost/locale.hpp>
#include <boost/filesystem/fstream.hpp>
#include <windows.h>
int main( int argc, char *argv[] )
{
    // Start the rand
    srand( time( NULL ) );
    // Create and install global locale
    std::locale::global( boost::locale::generator().generate( "" ) );
    // Make boost.filesystem use it
    boost::filesystem::path::imbue( std::locale() );
    // Check if set to utf-8
    if( std::use_facet<boost::locale::info>( std::locale() ).encoding() != "utf-8" ){
        std::cerr << "Wrong encoding" << std::endl;
        return -1;
    }
    std::string originalPath = "C:/test/s/一.png";
    // Convert to wstring (**WRONG!**)
    std::wstring newPath( originalPath.begin(), originalPath.end() );
    LPWSTR lp=(LPWSTR )newPath.c_str();
    CreateFileW(lp,GENERIC_READ | GENERIC_WRITE, FILE_SHARE_READ |
            FILE_SHARE_WRITE,     NULL,CREATE_ALWAYS,FILE_ATTRIBUTE_NORMAL,NULL );
    return 0;
}

但是,运行它,我在文件夹"C:\test\s"中进入了一个名为"¦ᄌタ.png"的文件,而不是我想要的"一.png"。我发现克服这个问题的唯一方法是交换线路

std::string originalPath = "C:/test/s/一.png";
// Convert to wstring (**WRONG!**)
std::wstring newPath( originalPath.begin(), originalPath.end() );

简单地

std::wstring newPath = L"C:/test/s/一.png";

在这种情况下,文件"一.png"完美地出现在文件夹"C:\test\s"中。尽管如此,我不能这样做,因为软件从 std::string 变量获取路径。我认为从 std::string 到 std::wstring 的转换以错误的方式执行,但是,可以看出,我在尝试理解这个逻辑时遇到了很深的问题。我详尽地阅读和研究谷歌,阅读了许多定性文本,但我所有的尝试似乎都是无用的。我尝试了MultiByteToWideChar函数和boost::filesystem,但两者都没有帮助,我在写入文件夹时根本无法获得正确的文件名。

我还在学习,所以如果我犯了一个愚蠢的错误,我非常抱歉。我的IDE是Eclipse,它被设置为UTF-8。

您需要实际将 UTF-8 字符串转换为 UTF-16。为此,您必须查找如何使用boost::locale::conv或(仅在Windows上)MultiByteToWideChar功能。

std::wstring newPath( originalPath.begin(), originalPath.end() );不起作用,它只会一个接一个地复制所有字节并将它们投射到wchar_t。

谢谢你的帮助,罗兰。最后,我设法找到了一个解决方案,我只是使用了以下库:"http://utfcpp.sourceforge.net/"。我使用函数"utf8::utf8to16"将我原来的UTF-8字符串转换为UTF-16,这样就可以让Windows正确显示中文字符。