是否有c++库实现了流式标记器?
Is there a c++ library that implements a streamy kind of tokenizer?
接口后面的内容:
class StreamTokenizer
{
public:
StreamTokenizer(const std::string delimiter);
std::list<std::string> add_data(const std::string);
std::string get_left_over();
};
StreamTokenizer d(" ");
std::list<std::string> tokens;
tokens.append(d.add_data("tok"));
tokens.append(d.add_data("1 t"));
tokens.append(d.add_data("ok2 tok3"));
tokens.push_back(d.get_left_over());
// tokens = {tok1, tok2, tok3}
// d = {}
它以块的形式接收数据,它应该返回到目前为止找到的所有令牌,它应该能够将剩余的数据连接到下一个块,并且它不应该保存已经被标记的数据。
请不要建议使用stringstream,除非你可以展示如何从它擦除已经标记的数据(我的流实际上是无限的)
是的,它被称为"标准库"。
你所要求的似乎在流可以很容易处理的范围内。
std::stringstream d;
d << "tok";
d << "1 t";
d << "ok2 tok3";
std::vector<std::string> tokens((std::istream_iterator<std::string>(d)),
std::istream_iterator<std::string>());
for (std::string s : tokens)
std::cout << s << "n";
结果:tok1
tok2
tok3
我在这里没有展示"get the rest"函数。我想istream::read
可能是显而易见的选择。
我想我应该补充:默认情况下,字符串将在流解释为空白的任何地方被打破,而不仅仅是空格字符。您可以通过编写自定义ctype
facet并将该facet注入流来更改它解释为空白的内容。例如,我在之前的回答中展示了如何对-
和/
进行此操作。
相关文章:
- 如果没有malloc,链表实现将失败
- 如何在c++中实现处理器调度模拟器
- 如何在c++中使用引用实现类似python的行为
- 实现无开销push_back的最佳方法是什么
- 使用简单类型列表实现的指数编译时间.为什么
- 如何在BST的这个简单递归实现中消除警告
- 实现一个在集合上迭代的模板函数
- 我应该实现右值推送功能吗?我应该使用std::move吗
- 如何正确实现和访问运算符的各种自定义枚举器
- C++Union/Struct位域的实现和可移植性
- 这个极客对极客的trie实现是否存在内存泄漏问题
- 在c++中实现LinkedList时,应出现未处理的错误
- 为左值和右值的包装器实现C++范围
- 使用模板进行堆栈实现; "name followed by :: must be a class or namespace"
- 使用GSoap实现ONVIF
- 在用于格式4的arm模拟器中实现功能时的一个问题
- 用于AVX的ln(x)的实现,m256
- 用常见虚拟函数实现的任意组合来实现派生类的正确方法是什么
- 在C++中,如何在类和函数(可能是模板化的)的头中编写完整的实现
- std::random_device是如何实现的