为什么UChar*不适用于此ICU转换

why UChar* is not working with this ICU conversion?

本文关键字:ICU 转换 适用于 不适用 UChar 为什么      更新时间:2023-10-16

从 UTF-8 转换为 ISO-8859-6 时,此代码不起作用:

UnicodeString ustr = UnicodeString::fromUTF8(StringPiece(input));
const UChar* source = ustr.getBuffer();
char target[1000];
UErrorCode status = U_ZERO_ERROR;
UConverter *conv;
int32_t     len;
// set up the converter
conv = ucnv_open("iso-8859-6", &status);
assert(U_SUCCESS(status));
// convert 
len = ucnv_fromUChars(conv, target, 100, source, -1, &status);
assert(U_SUCCESS(status));
// close the converter
ucnv_close(conv);
string s(target);
return s;

图片: (1,2)

但是,当用硬编码的UChar[]替换UChar*时,它工作得很好!!图片 : (3)

看起来你正在采取困难的方法。这个怎么样:

static char const* const cp = "iso-8859-6";
UnicodeString ustr = UnicodeString::fromUTF8(StringPiece(input));
std::vector<char> buf(ustr.length() + 1);
std::vector<char>::size_type len = ustr.extract(0, ustr.length(), &buf[0], buf.size(), cp);
if (len >= buf.size())
{
    buf.resize(len + 1);
    len = ustr.extract(0, ustr.length(), &buf[0], buf.size(), cp);
}
std::string ret;
if (len)
    ret.assign(buf.begin(), buf.begin() + len));
return ret;