原理
在递归下降LL(1)分析法中,每个非终结符对应一个分析子程序,分析程序从调用文法开始符号所对应的分析子程序开始执行。
1.按照文法规则,每遇到一个终结符,则判断当前读入的单词符号是否与该终结符相匹配,若匹配,则继续读取下一个单词符号;若不匹配,则进行错误处理。
2.每遇到一个非终结符,则调用相应的分析子程序。以此方法,实现完整的字符串的语法分析。
程序思想
递归下降分析法是对文法的每个非终结符编制一个递归过程(函数), 按产生式规则右部符号串的顺序编写。
代码
#include<string.h>
#include<iostream>
using namespace std;//定义几个全局变量
int syn;
char s[1000];
int p=0;
int k=0;// 定义 k 作为一个标记符,记录是否出错,若 k=0 ,则说明没有出错,否则发生错误
char key[6][20] = {"begin","if","then","while","do","end"};//定义一个二维数组存放关键字
char token[20]; //存放字符(单词)
void expression();//判断关键字
int isKey(char s[])
{
for(int i = 0; i < 6;i++)
{
if(strcmp(s,key[i]) == 0)
{
return i+1; //关键字的种别码依次为 begin=1,if=2,then=3,while=4,do=5,end=6即为 i+1 的值
}
}
return -1;
}
bool isChar(char ch)
{
if((ch>='a' && ch<='z') || (ch>='A' && ch<='Z'))
return true;
else
return false;
}
bool isNum(char ch)
{
if(ch>='0' && ch<='9')
return true;
else
return false;
}
void scanner()
{
int count = 0;
if(s[p] == ' ') p++;
if(isChar(s[p]))
{
while(isNum(s[p]) || isChar(s[p]))
{
token[count++] = s[p];
p++;
}
token[count] = '\0'; //'\0'作为结束符 ,将单词分隔开
syn = isKey(token);
if(syn == -1)
{
syn = 10; //标识符letter(letter|digit) *
}
}
else if(isNum(s[p]))
{
while(isNum(s[p]))
{
token[count++] = s[p];
p++;
}
token[count] = '\0';//结束标识
syn = 11; //数字digit(digit) *
}
else
{
switch(s[p])
{
case '+': syn = 13;token[0] = s[p];token[1]='\0';break;
case '-': syn = 14;token[0] = s[p];token[1]='\0';break;
case '*': syn = 15;token[0] = s[p];token[1]='\0';break;
case '/': syn = 16;token[0] = s[p];token[1]='\0';break;
case '=': syn = 25;token[0] = s[p];token[1]='\0';break;
case ';': syn = 26;token[0] = s[p];token[1]='\0';break;
case '(': syn = 27;token[0] = s[p];token[1]='\0';break;
case ')': syn = 28;token[0] = s[p];token[1]='\0';break;
case '#': syn = 0 ;token[0] = s[p];token[1]='\0';break;
}
if(s[p] == ':')
{
token[count++] = s[p];
if(s[p+1] == '=')
{
p++;
token[count++] = s[p];
syn = 18;
}
else
{
syn = 17;
}
token[count] = '\0';
}
if(s[p] == '<')
{
token[count++] = s[p];
if(s[p+1] == '>')
{
p++;
token[count++] = s[p];
syn = 21;
}
else if(s[p+1] == '=')
{
p++;
token[count++] = s[p];
syn = 22;
}
else
{
syn = 20;
}
token[count] = '\0';
}
if(s[p] == '>')
{
token[count++] = s[p];
if(s[p+1] == '=')
{
p++;
token[count++] = s[p];
syn = 24;
}
else
{
syn = 23;
}
token[count] = '\0';
}
p++; //判断运算符和界符的这部分由于指针 p 没有向后指,所以需要将指针 p 向后移一位
}
}
void factor() //因子 :<因子> :=ID | NUM | (<表达式>)
{
if(syn==10||syn==11) //当扫描的是数字或者字母时,继续扫描
{
scanner();
}
else if(syn==27) //当扫描到 '('时,后面应该为一个表达式,继续扫描
{
scanner();
expression();
if(syn==28) //当扫描的是 ')'时,继续扫描
scanner();
else
{
k=1; //出错
cout<<"ERROR!缺少')'"<<endl; //表达式缺 ')',出错
}
}
else
{
k=1;
cout<<"ERROR!运算符号后面不是常数或'('或标识符"<<endl; //扫描表达式 ,表达式不是以 '('开头
}
}
void term()//项 : <项> :=<因子>{*<因子> | /<因子> }
{
factor();
while(syn==15||syn==16) //当开头扫描的是 '*' 或者 '/'时('*'或者'/'后面是因子),继续扫描
{
scanner();
factor();
}
}
void expression()//表达式 : <表达式> :=<项>{+<项> | -<项>}
{
term();
while(syn==13||syn==14) //当开头扫描的是 '+' 或者 '-'时('+'或者'-'后面是项),继续扫描
{
scanner();
term();
}
}
int main()
{
char ch;
while(true)
{
cout<<"Please input a string: "<<endl;
cin.getline(s,1000);//getline()函数可以滤去空格
p=0;
scanner();
expression();
if(syn==0&&k==0) //当数字串最后扫描的是 '#',而且无出错,分析成功
cout<<"success!" <<endl;
else if(syn!=0||k==1)
cout<<"error!"<<endl;
}
return 0;
}