c++ /CLI字符串数组到本地c++字符的转换

Conversion of C++/CLI array of strings to native C++ char**

本文关键字:c++ 字符 转换 CLI 字符串 数组      更新时间:2023-10-16

在c++/CLI中,将字符串数组转换为本地char**的最有效方法是什么?

我正在做这个:

array<String^>^ tokenArray = gcnew array<String^> {"TokenONE", "TokenTWO"};
int numTokens = tokenArray->Length;
char** ptr = new char* [numTokens];
for(int i = 0; i < numTokens; i++)
    {
        // See: http://stackoverflow.com/questions/6596242/
        array<Byte>^ encodedBytes = Text::Encoding::UTF8->GetBytes(tokenArray[i]);
        pin_ptr<Byte> pinnedBytes = &encodedBytes[0];
        ptr[i] = reinterpret_cast<char*>(pinnedBytes);
    }
int myResult = someNativeFunction(ptr, numTokens);
delete ptr;
// ...

有什么需要改进的地方吗?从内存管理的角度来看,这是ok的吗?如果需要,我可以更改someNativeFunction的参数。

谢谢。

除了固定指针在传递给someNativeFunction()之前超出作用域的问题之外,可以简化代码以获得更好的清晰度,特别是如果您使用的是MSVC2008或更新版本。有关如何转换单个字符串(扩展到数组应该是微不足道的)的信息,请参阅本页。

编辑:

如果你需要ANSI字符串const char*,那么复制是不可避免的,因为。net字符串是Unicode (UTF-16)。在MSVC2008及更新版本上,您的代码可能如下所示:

#include <msclr/marshal.h>
using namespace msclr::interop;
marshal_context context;
array<String^>^ tokenArray = gcnew array<String^> {"TokenONE", "TokenTWO"};
char** tokensAsAnsi = new char* [tokenArray->Length];
for(int i = 0; i < tokenArray->Length; i++)
{
    tokensAsAnsi[i] = context.marshal_as<const char*>(tokenArray[i]);
}
int myResult = someNativeFunction(ptr, tokensAsAnsi);
// The marshalled results are freed when context goes out of scope
delete[] tokensAsAnsi;    // Please note you must use delete[] here!

这与您的代码示例类似,但不需要指针固定和reinterpret_cast -ing。

如果你愿意在someNativeFunction()中处理宽字符串const wchar_t*,你可以直接使用(固定的)内部数据,但是,你必须确保指针保持固定直到someNativeFunction()返回,正如在评论中指出的那样,可能会对GC性能产生负面影响。

如果您要编组许多字符串,并且性能是最重要的问题,您可以在将所有内容传递给someNativeFunction()之前,将封送分配给多个线程。在此之前,我建议对您的应用程序进行分析,看看转换是否真的是一个瓶颈,或者将精力集中在其他地方是否更好。

编辑# 2:

要获得UTF-8编码的本机字符串,您可以使用修改版本的代码:

array<String^>^ tokenArray = gcnew array<String^> {"TokenONE", "TokenTWO"};
char** tokensAsUtf8 = new char* [tokenArray->Length];
for(int i = 0; i < tokenArray->Length; i++)
{
    array<Byte>^ encodedBytes = Text::Encoding::UTF8->GetBytes(tokenArray[i]);
    // Probably just using [0] is fine here
    pin_ptr<Byte> pinnedBytes = &encodedBytes[encodedBytes->GetLowerBound(0)];
    tokensAsUtf8[i] = new char[encodedBytes->Length + 1]; 
    memcpy(
        tokensAsUtf8[i], 
        reinterpret_cast<char*>(pinnedBytes),
        encodedBytes->Length
        );
    // NULL-terminate the native string
    tokensAsUtf8[i][encodedBytes->Length] = ''; 
}
int myResult = someNativeFunction(ptr, tokensAsAnsi);
for(int i = 0; i < tokenArray->Length; i++) delete[] tokensAsUtf8[i];
delete[] tokensAsUtf8;    

如果你关心速度,你可以为本地字符串预先分配一个大的缓冲区(如果你知道只有有限的数量),或者使用池存储。

编辑#3:(OG Dude)只是修正了一些小的打字错误。