编译原理期末复习--词法分析前言 ok也是很快地开始第二章的复习,这部分就会稍微有一点点地上难度了,不过依旧是洒洒水所以

ok也是很快地开始第二章的复习,这部分就会稍微有一点点地上难度了,不过依旧是洒洒水所以快速过一遍.

从左往右逐字符地扫描源程序并识别出每一个单词,并且对其编码(种别码、token值),并最后输出一串token串提交给语法分析程序如果识别过程中发现错误或无法识别报告错误.

每个单词在词法分析时对应的编码值.

该状态转换图表示表示符的构成规则,必须是字母开头,后跟若干个字母数字,最后以其他字符表示标识符的结束

ε是一个正则表达式,表示正规集L(ε)={ε},即只包含空串
对任何a∈字母表,其正规集L(a)={a}
设e₁,e₂是字母表上的正则表达式,所表示的正规集为L(e₁)L(e₂)则:
1. (e₁)是正则表达式,代表L(e₁)
2. e₁|e₂是正则表达式,代表L(e₁)∪L(e₂)
3. e₁·e₂,代表L(e₁)L(e₂)
4. e₁,代表(L(e₁))* 运算顺序为先* 再 · 最后 |

若两个正则表达式的正则集相同则二者等价

可以不了解其他,但是不能不懂这个

有穷自动机可以准确地识别正规集,通过构造有穷自动机可以把正则表达式编译成识别器.

DFA是一个由五元组定义的数学模型:M=(S,Σ,δ,s₀,F)

DFA有三种表示方式

DFA的状态转移函数是单值函数,即每一个状态在面临一输入字符的时候有一个确定的后继状态.

如果某字符串从DFA的初态出发能到达终态,则称该字符串被该DFA所接受.

NFA是一个由五元组定义的数学模型:M=(S,Σ,δ,S₀,F)

首先对于一个NFA必定存在一个DFA使得NFA和DFA等价

构造DFA的方法很多最重要的一种是子集法,即一个DFA的状态对应多个NFA的状态.

状态集合I的闭包记作ε_Closure(I):指集合中的状态,经过数次ε边所到达的所有状态的集合与自身的并集 I_a=ε_Closure(move(I,a)),move(I,a)指状态集合I进过a所能到达的状态集合.

确定化的步骤: