查找occurrence并将其替换为wchart
find and replace occurrence with wchar_t
我需要开发一个小函数来查找wchar_t字符序列中的出现。该函数将指向字符串的指针wchart*作为输入,但由于它是unicode,因此每个字符的值显然都显示为数字。
有没有一种优雅的方法可以做到这一点,而不必解析字符串中的每一个字母并比较unicode数字?当我试图将指针传递给函数时,这个函数只使用第一个字符,为什么?
std::wstring
和std::wstream
应该完成这项工作,前提是locale
设置正确:
#include <iostream>
#include <fstream>
#include <string>
using namespace std;
static void searchAndReport(const wstring &line) {
wstring::size_type pos = line.find(L"な"); // hiragana "na"
if (wstring::npos == pos) {
wcout << L"見つかりません" << endl; // not found
return;
}
for (bool first = true; wstring::npos != pos; pos = line.find(L"な", pos + 1)) {
if (first)
first = false;
else
wcout << L", " ;
wcout << L"第" << pos << L"桁" ; // the pos-th column
}
wcout << endl;
}
static void readLoop(wistream &is) {
wstring line;
for (int cnt = 0; getline(is, line); ++cnt) {
wcout << L"第" << cnt << L"行目: " ; // the cnt-th line:
searchAndReport(line);
}
}
int main(int argc, char *argv[]) {
// locale::global(std::locale("ja_JP.UTF-8"));
locale::global(std::locale(""));
if (1 < argc) {
wcout << L"入力ファイル: [" << argv[1] << "]" << endl; // input file
wifstream ifs( argv[1] );
readLoop(ifs);
} else {
wcout << L"標準入力を使用します" << endl; // using the standard input
readLoop(wcin);
}
}
成绩单:
$ cat scenery-by-bocho-yamamura.txt
いちめんのなのはな
いちめんのなのはな
いちめんのなのはな
いちめんのなのはな
いちめんのなのはな
いちめんのなのはな
いちめんのなのはな
かすかなるむぎぶえ
いちめんのなのはな
$ ./wchar_find scenery-by-bocho-yamamura.txt
入力ファイル: [scenery-by-bocho-yamamura.txt]
第0行目: 第5桁, 第8桁
第1行目: 第5桁, 第8桁
第2行目: 第5桁, 第8桁
第3行目: 第5桁, 第8桁
第4行目: 第5桁, 第8桁
第5行目: 第5桁, 第8桁
第6行目: 第5桁, 第8桁
第7行目: 第3桁
第8行目: 第5桁, 第8桁
所有文件都是UTF-8格式。
注意不要混合cout
和wcout
:
- https://gcc.gnu.org/bugzilla/show_bug.cgi?id=27569
环境:
$ lsb_release -a
LSB Version: core-2.0-amd64: [...snip...]
Distributor ID: Ubuntu
Description: Ubuntu 12.04.5 LTS
Release: 12.04
Codename: precise
$ env | grep -i ja
LANGUAGE=ja:en
GDM_LANG=ja
LANG=ja_JP.UTF-8
$ g++ --version
g++ (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3
Copyright (C) 2011 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
相关文章:
- 模板参数替换失败,并且未完成隐式转换
- 如何用转义符替换字符串中的所有特殊字符
- 为什么除非添加括号,否则构造函数上的模板替换会失败?
- 在一个读写器队列中,我可以用volatile替换原子吗
- 用符号版本替换对函数的所有调用
- 如何通过替换顺序代码的while循环来添加OpenMP for循环
- 替换基于地图的所有引用
- 按平均值替换数组中的元素
- 我可以在这里替换什么,因为我不能在 C# 中使用隐式变量的 lambda 函数?
- 如何将字节数组元素替换为修改的十六进制 ASCII 符号?
- 初始化 std::vector 替换为单大括号而不是双大括号
- 删除/替换C++字符串中的多字符 (ÿû)
- 将 malloc 替换为数组
- 如何替换此示例代码片段中已弃用的handler_type_t或 boost::asio::handler_type?
- 如何在C++中用'\'替换''来处理转义序列?
- 替换密码:哪一个?
- 替换 C++17 中移除的绑定 1st
- 将 Boost MPL 容器替换为 C++17 功能
- C++:如何用单个命令替换复杂的迭代?
- 查找occurrence并将其替换为wchart