编译器构造- c++标记化
compiler construction - C++ tokenization
我正在用c++编写一个词法分析器,并且我正在从文件中逐个字符地读取,但是,在这种情况下如何进行标记化?我不能使用strtok,因为我有字符而不是字符串。不知怎么的,我要一直读到定界器?
答案是是。您需要继续阅读,直到遇到分隔符。
有多种解决方案
最简单的做法就是:保留已经读取的字符的缓冲区(std::string
),直到到达分隔符。此时,从缓冲区中累积的字符构建一个标记,清除缓冲区,并将分隔符(如果需要)推入缓冲区。
另一个解决方案是提前读取:即,使用std::getline
(例如)拾取整行,然后检查该行上的内容。一般来说,行尾是一个自然的标记分隔符。
这个工作得很好…当分隔符容易使用时。
不幸的是,有些语言,如c++,有令人尴尬的语法。例如,在c++中,>>
可以是:
- 操作符
>>
(右移和流提取) - 两个嵌套模板的结尾(即可以重写为
> >
)
在那些情况下…好吧,不要为标记器中的差异而烦恼,让您的AST构建通过消歧,它有更多的信息。
根据您提供的信息。如果你想从一个文件中读取一个分隔符,使用getline(char *,int,char)函数。
getline()用于读取最多n个字符或最多一个分隔符。
的例子:
#include<fstream.h>
using namespace std;
main()
{
fstream f;
f.open("test.cpp",ios::in);
char *c;
f.getline(c,2,' ');
cout<<c; // upto 1 char or till a space
}
相关文章:
- C/C++编译器通常会删除重复的库吗
- 模板-模板参数推导:三个不同的编译器三种不同的行为
- Win32编译器选项和内存分配
- MSVC多行宏编译器错误
- 静态数据成员的问题-修复链接错误会导致编译器错误
- C++,我收到一个无法理解的编译器错误
- 在线编译器中的分段C++没有打印消息
- 如何解决gcc编译器优化导致的centos双编译器设置中的分段错误
- C/C++预处理器是否可以检测一些编译器选项
- 是否有C++编译器选项允许激进地删除所有函数调用,并将参数传递给具有空体的函数
- C++错误C2600:无法定义编译器生成的特殊成员函数(必须首先在类中声明)
- 我需要知道编译器如何在cpp中使用析构函数
- 编译器如何区分std::vector的构造函数
- CLANG 编译器 说:变量"PTR"可能未初始化
- 告诉c++编译器该参数没有别名
- 使用仅使用一次的变量调用的复制构造函数.这可能是通过调用move构造函数进行编译器优化的情况吗
- 为什么所有C++编译器都会崩溃或挂起此代码
- 编译器如何在使用SFINAE的函数和标准函数之间确定两者是否可行
- 我收到同义重复编译器错误。我应该如何修复"类型"X"的参数与类型"X"的参数不兼容?
- 为什么C++编译器没有检测到正确声明的类?