您的位置：首页 > 其它

编译原理实验（三）词法语法分析综合设计

2018-03-11 17:45 736 查看

版权声明：本文为原创文章，版权归 Geekerstar 所有。

本文链接：http://www.geekerstar.com/technology/105.html

除了有特殊标注文章外欢迎转载，但请务必标明出处，格式如上，谢谢合作。

1 概述

通过某种高级语言（如C/C++，Java）实现词法，语法分析器的功能。

2 实验目标

理解并掌握词法，语法分析的原理与方法。

能够使用某种语言实现词法，语法分析程序。

对编译的基本概念，原理和方法有完整和清楚的理解，并能正确而熟练的运用。

3 实验描述

3.1 实验要求

采用词法分析程序作为语法分析程序子程序的方法，实现词法、语法分析。

具体要求如下：

词法分析程序作为语法分析程序的子程序。

输入数据：程序段。

输出结果：语法分析结果，包括错误列表。

3.2 本实验概述

本次实验采用C++编写词法语法分析器，在此基础上，采用递归下降

分析程序，实现对词法分析程序所提供的单词序列的语法检查和结构分

析。PL/0语言功能简单，结构清晰，可读性强，而又具备了一般的高级

程序设计语言的必须部分，所以采用PL/0语言的编译程序能充分体现一

个高级语言编译程序实现的基本方法和技术，故采用PL/0语言进行词法语法分析。

4 技术分析

4.1 词法语法分析

本次实验主要用到的是基本的数据结构分析，C++编程技术，编译原理等，

其中对编译的基本概念抓住词法分析与语法分析两个部分来理解：

词法分析

词法分析器根据词法规则识别出源程序中的各个记号，每个记号代表一

类单词。源程序中常见的记号可以归为几大类：关键字、标识符、字面量和

特殊符号。词法分析器的输入是源程序，输出是识别的记号流。词法分析器

的任务是把源文件的字符流转换成记号流。它是编译过程的第一个阶段。其

主要任务是从左到右依次描描字符串形式的源程序的各个字符，逐个识别出

其中的单词，并将其转换成为内部编码形式的单词符号串输出，用于进行语法分析。

概括的说，语法器在其工作过程中，一般应完成下列的任务：

（1）识别出源程序中的各个单词符号，并将其转换成内部编码形式；

（2）删除无用的空白字符、回车字符以及其他非实质性字符；

（3）删除注释；

（4）进行词法检查，报告所发现的错误。

此外，视编译工作流程的组织，一些编译程序在进行词法分析时，还要

完成将所识别出的标志符登录到符号表的工作。

语法分析：

语法分析是编译过程的核心，分析的任务是根据语法规则分析源程序的

语法结构，并在分析过程中，对源程序进行语法检查，如果语法没有错误，

则给出正确的语法结构，为语义分析和代码生成做准备。

目前语法分析方法有多种多样，大致分为自顶而下和自底而上两大类。

自顶而下又分为LL（1）分析方法和递归下降分析方法。自底而上又分为简

单优先文法、算符优先文法、LR（K）分析方法。下面主要介绍自底而上的

LR（K）分析方法。

自底向上分析法，也称移进-归约分析法。它的实现思想是对输入符号串

自左向右进行扫描，并将输入符逐个移入一个后进先出栈中，边移入边分析，

一旦栈顶符号串形成某个句型的句柄时，(该句柄对应某产生式的右部)，就

用该产生式的左部非终结符代替相应右部的文法符号串，这称为移步归约。

重复这一过程直到归约到栈中只剩文法的开始符号时则为分析成功，也就确

认输入串是文法的句子。否则，分析失败，表示输入符号串不是文法的一个

句子，其中必定存在语法错误。

根据以上编译的相关知识结合C++编程语言和部分数据结构的知识来写词法语法分析器。

5 设计与实现

5.1 设计思路

编制一个递归下降分析程序，实现对词法分析程序所提供的单词序列的

语法检查和结构分析。利用C++编写递归下降分析程序，并对PL/0语言进行

语法分析。核心思想就是，从开始状态开始，按照文法展开式，逐级进行状态分析，直

到分析完毕，如果在此期间出现状态不匹配，即语法错误，停止分析。当然

在实际的语法分析器要有错误恢复机制，以发现其他的语法错误。即一次报

告多个语法错误。此外要想实现语法分析，必须先有词法分析，用词法分析

的结果进行语法分析。

用扩充的BNF表示如下：

编制一个递归下降分析程序，实现对词法分析程序所提供的单词序列的

语法检查和结构分析。

利用C++编写递归下降分析程序，并对PL/0语言进行语法分析。

\<程序>：：=begin\<语句串>end

\<语句串>：：=\<语句>{；\<语句>}

\<语句>：：=\<赋值语句>

\<赋值语句>：：=ID：=\<表达式>

\<表达式>：：=\<项>{+\<项> | -\<项>}

\<项>：：=\<因子>{*\<因子> | /\<因子>

\<因子>：：=ID | NUM | （\<表达式>）

输入单词串，以“#”结束，如果是文法正确的句子，则输出成功信息，

打印“语法分析成功！”，否则输出“语法分析错误（错误原因）”。

例如：

输入 begin a:=4; b:=2*3; c:=a+b end #

输出语法分析成功！

输入 x:=a+b*c end #

输出缺少begin！


单词符号	种别编码
Begin	1
If	2
Then	3
While	4
Do	5
End	6
标识符	10
数字	20
+	13
-	14
*	15
/	16
:	17
:=	18
\<	20
\<>	21
\<=	22
>	23
>=	24
=	25
4000 ;	26
(	27
)	28
#	0

5.2 实现方法

本实验采用C++编码，其中主要编写了以下几个函数及功能：

Void cifa() //词法分析

Void fun_yufa() //判断语法是否有错误

Void fun_op() //处理运算符(\*和/)

Void exp() //处理运算符（+和-）

Void fun_yuju() //判断是否有语句错误(:=)

Void fun_end() //判断程序是否结束

Void yufa() //采用递归下降的语法分析

其中cifa()进行词法分析，调用yufa()用词法分析的结果进行语法分析。

图1 词法分析部分代码

图2 语法分析部分实现函数

5.3 测试用例


项目/软件	词法语法分析器	程序版本	V1.0
功能模块名	词法语法分析模块	编制人	XX
用例编号	T1.0	编制时间	207.11.20
功能特性	词法语法定义分析判断
测试目的	判断词法语法是否正确
测试数据	1：begin a:=3;b:=24;c:=a+b;end # 2：a:=3;b:=24;c:=a+b; end # 3：begin a:=3;b:=2*4;c:=a+b; #
测试用例	操作描述	代码	期望结果	实际结果	测试状态
1	输入第一段代码	begin a:=3;b:=2*4;c:=a+b;end #	语法分析正确	语法分析正确	良好
2	输入第二段代码	a:=3;b:=2*4;c:=a+b; end #	缺少Begin	缺少begin	良好
3	输入第三段代码	begin a:=3;b:=2*4;c:=a+b; #	缺少结束符	缺少结束符	良好

5.4 实验结果及分析

输入一段PL/0语言，比如输入：begin a:=3;b:=2*4;c:=a+b; end #

此段代码语法是正确的，所以经过词法语法分析输出的结果应该是：语

法分析正确！如下图所示：

图3 实验结果1

当我们漏掉begin，语法分析器应该检测出并输出：缺少begin！如下图：

图4 实验结果2

6 总结

经过这次实验，我对编译原理有了更近一步的理解，让我知道了词法分

析的功能是输出把它组织成单个程序，让我了解到如何设计、编写并调试词

法分析程序，对语法规则有明确的定义；编写的分析程序能够进行正确的语

法分析；对于遇到的语法错误，能够做出简单的错误处理，给出简单的错误

提示，保证顺利完成语法分析过程，并且通过实验的练习，加强了对基本概

念的理解和应用，对以后的学习也打下了基础。目前程序也存在着少量不足

之处，主要是语法分析部分还有不完善的地方，错误报告也有待改进，希望

在经过进一步的学习后，这些问题能逐步解决。

7 参考文献

1.互联网：百度，CSDN博客。

2.教材：《编译技术》张莉高等教育出版社。

3.教材：C++ primer plus（第六版）

8 代码展示

#include "cstdio"
#include "string"
#include "iostream"
#include "algorithm"
#include "cstring"
using namespace std;

char str[1000];            //从键盘输入
char bzf[8];      //判断是否是关键字
char ch;
char *keyword[6]={"begin","if","then","while","do","end"};
int num,p,m,n,sum;
int x;

void cifa()   //词法分析
{
sum=0;
for(m=0;m<8;m++)
bzf[m++]=NULL;
m=0;
ch=str[p++];
while(ch==' ')       //去掉空格
ch=str[p++];
if(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A')))  //标识符
{
while(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A'))||((ch>='0')&&(ch<='9')))
{
bzf[m++]=ch;
ch=str[p++];
}
p--;
num=10;
bzf[m++]='\0';
for(n=0;n<6;n++)
if(strcmp(bzf,keyword
)==0)
{
num=n+1;
break;
}
}
else if((ch>='0')&&(ch<='9'))  //数字
{
while((ch>='0')&&(ch<='9'))
{
sum=sum*10+ch-'0';
ch=str[p++];
}
p--;
num=11;
}
else
switch(ch)     //符号
{
case '<':
m=0;
ch=str[p++];
if(ch=='>')
{
num=21;
}
else if(ch=='=')
{
num=22;
}
else
{
num=20;
p--;
}
break;

case '>':
m=0;
ch=str[p++];
if(ch=='=')
{
num=24;
}
else
{
num=23;
p--;
}
break;

case ':':
m=0;
ch=str[p++];
if(ch=='=')
{
num=18;
}
else
{
num=17;
p--;
}
break;

case '+':
num=13;
break;

case '-':
num=14;
break;

case '*':
num=15;
break;

case '/':
num=16;
break;

case '(':
num=27;
break;

case ')':
num=28;
break;

case '=':
num=25;
break;

case ';':
num=26;
break;

case '#':
num=0;
break;

default:
num=-1;
break;
}
}
void term();
void exp();
void fun_yufa()   //判断语法是否错误
{
if((num==10)||(num==11))//关键字，数字
{
cifa();
}
else if(num==27)
{
cifa();
exp();

if(num==28)
{
cifa();          /*读下一个单词符号*/
}
else
{
printf("缺少‘(’\n");
x=1;
}
}
else
{
printf("语法错误\n");
x=1;
}
return;
}
void fun_op()  //处理运算符
{
fun_yufa();
while((num==15)||(num==16))//  '*'和'/'
{
cifa();             /*读下一个单词符号*/
fun_yufa();
}
return;
}

void exp()   //处理运算符
{
fun_op();
while((num==13)||(num==14))   //+和-
{
cifa();               /*读下一个单词符号*/
fun_op();
}

return;
}

void fun_yuju()  //判断是否有语句错误
{
if(num==10)
{
cifa();        /*读下一个单词符号*/
if(num==18)
{
cifa();      /*读下一个单词符号*/
exp();              }
else
{
printf("':='错误\n");
x=1;
}
}
else
{
printf("语法错误!\n");
x=1;
}

return;
}

void fun_end()  //判断程序结束的标志
{
fun_yuju();         /*调用函数statement();*/

while(num==26)
{
cifa();          /*读下一个单词符号*/
if(num!=6)
fun_yuju();          /*调用函数statement();*/
}

return;
}

void yufa()  //递归下降语法分析
{
if(num==1)
{
cifa();
fun_end();
if(num==6)
{
cifa();
if((num==0)&&(x==0))
printf("语法分析正确!\n");
}
else
{
if(x!=1) printf("缺少end!\n");
x=1;
}
}
else
{
printf("缺少begin!\n");
x=1;
}

return;
}

int main()
{
p=x=0;
printf("请输入一段语句以#结束: \n");
do
{
scanf("%c",&ch);
str[p++]=ch;
}while(ch!='#');
p=0;
cifa();
yufa();
return 0;
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 编译原理课程设计试验词法分析器语法分析

相关文章推荐

新的分享

章节导航