编译原理之词法分析实验(附完整C/C++代码与总结)

news2024/10/6 18:30:25

一、实验内容

        通过完成词法分析程序,了解词法分析的过程。编制一个读单词程序,对PL/0语言进行词法分析,把输入的字符串形式的源程序分割成一个个单词符号,即基本保留字、标识符、常数、运算符、分界符五大类。

        对PL/0语言进行词法分析,把输入的字符串形式的源程序分割成一个个单词符号,其词法描述如下:

(1)关键字:

begin,call,const,do,end,if,odd,procedure,read,then,var,while,write

(2) 标识符:用来表示各种名字,必须以字母开头小于10位字符组成

(3) 数字:以0-9组成小于14位的数字

(4) 运算符:+,-,*,/,:=,<,<=,>,>=,#

(5) 分界符:, ,. ,; ,( ,)


二、实验代码

#include<iostream>
#include<stdio.h>
#include<string.h>
#include<iomanip>
using namespace std;
//创建四个表,储存符号 
const char *k[13]={"begin","call","const","do","end","if","odd","procedure","read","then","var","while","write"};//关键字表
const char *s1[5]={",",".",";","(",")"};//界符表
const char *s2[6]={"+","-","*","/","++","--",};//运算符号表 
const char *s3[9]={"<=",">",">=","=",">",">=","<>",":=","#"}; //关系运算符号表 
//定义全局变量
int row=1,line=1; 
int t,p=0;//单词类别码以及记录移动指针
char instring[100];//保存输入的程序代码缓存数组
char outtoken[10];//输出
char ci[8],id[10];//暂时保存数字和字符
//函数的声明
void analysis();//分析函数,决定调用哪个函数进行分析
void symbol();//分析以非字母数字开头的字符
void constant();//分析常数
void alphabet();//分析标识符和关键字
void show();//打印输出函数
bool isnumber(char x);//判断是否是数字 
bool isalpha(char x);//判断是否是字母 
int main(){
	cout<<"请输入一段程序代码并以@结束:"<<endl;
	//输出程序代码 
	do{
		instring[p++]=getchar();
	} while(instring[p-1]!='@'); 
	getchar();//吸收回车键 
	instring[p-1]='\0';//抵消掉@
	p=0;//移动指针归零
	cout<<left;
	cout<<"------------------------------------------------------------------------------"<<endl; 
	cout<<setw(6)<<"单词"<<"			"<<setw(6)<<"二元序列"<<"			"<<setw(6)<<"类型"<<"			"<<endl;
	//扫描输入的字符 
	while(p<strlen(instring)){
		analysis();
		show();
	} 
	cout<<"------------------------------------------------------------------------------"<<endl; 
	cout<<"[注]:"<<endl;
	cout<<"t=1:关键字,"<<"t=2:分界符,"<<"t=3:算术运算符,"<<"t=4:关系运算符,"<<"t=5:常数,"<<"t=6:标识符,"<<"t==7:词法出错"<<endl; 
	cout<<"@为结束符,不参与到词法分析中"<<endl; 
	cout<<endl;
	return 0;
} 
//判断是否是数字
bool isnumber(char x){
	return x>='0'&&x<='9';
}
//判断是否是字母
bool isalpha(char x){
	return (x>='a'&&x<='z'||x>='A'&&x<='Z');
}
//分析函数,决定调用哪个函数进行分析
void analysis(){
	strcpy(outtoken,"");//清空outtoken数组
	while(instring[p]==' '||instring[p]=='\n'){
		if(instring[p]=='\n'){
			row++;
			line=1;
		}
		p++;
	} 
	//执行完之后指向第一个不为空格的字符
	char ch=instring[p];
	//按照字符的类别调用不同的分析处理函数 
	if(isalpha(ch))
	   alphabet();
	else if(isnumber(ch))
		constant();
	else 
		symbol();
}
//常数处理函数
void constant(){
	strcpy(ci,"");//清空ci
	t=5;//类别码
	int i=0;
	while(isnumber(instring[p])){
		ci[i++]=instring[p++]; 
	} 
	while(isalpha(instring[p])||isnumber(instring[p])){
		ci[i++]=instring[p++];
		t=7;//出错 
	}
	ci[i]='\0';//结束符
	//strcpy_s(outtoken,strlen(ci)+1,ci);
	strcpy(outtoken,ci);
	line++;
	return; 
} 
//标识符和关键字的分析函数
void  alphabet(){
	strcpy(id,"");//清空id
	int i=0;
	//读取连续的字母数字序列 
	while(isalpha(instring[p])||isnumber(instring[p])){
		id[i++]=instring[p++];//p指向连续序列之后的第一个字符 
	} 
	id[i]='\0';
	//查关键字表 
	for(i=0;i<8;i++){
		if(strcmp(id,k[i])==0){
			t=1;//表示关键字
			line++;
			strcpy(outtoken,id);
			return; //是关键字的话,直接退出 
		}
	}
	//查看是否是标识符
	for(i=0;i<strlen(id);i++){
		if(!(isalpha(id[i])||isnumber(id[i]))){
			t=7;
			strcpy(outtoken,id);
			line++;
			return;
		}
	} 
	line++;
	t=6;//不是关键字且没有出错即为标识符
	strcpy(outtoken,id);
}
//其它运算符的分析函数
void symbol(){
	char ch=instring[p++];
	char ch2=instring[p];
	t=7;
	switch(ch){
		case '+':
			if(ch2=='+')
			  t=3;
			break;
		case '-':
			if(ch2=='-')
			  t=3;
			break;
		case '>':
			if(ch2=='=')
			  t=4;
			break;
		case '<':
			if(ch2=='='||ch2=='>')
			  t=4;
			break;
		case ':':
			if(ch2=='=')
			  t=3;
			break;
	}
	//判断是否具有两个符号的运算符
	if(ch=='>'&&ch2=='='||ch=='<'&&ch2=='='||ch=='<'&&ch2=='>'||ch=='+'&&ch2=='+'||ch=='-'&&ch2=='-'||ch==':'&&ch2=='='){
		p++;
		outtoken[0]=ch;
		outtoken[1]=ch2;
		outtoken[2]='\0';
		line++;
		return;
	} else{
		char chq[2];
		chq[0]=ch;
		chq[1]='\0';
		//分界符比较 
		for(int i=0;i<6;i++){
			if(strcmp(chq,s1[i])==0){
				t=2;
				break;
			}
		}	
		//算术运算符比较 
		for(int i=0;i<6;i++){
			if(strcmp(chq,s2[i])==0){
				t=3;
				break;
			}
		}	
		//关系运算符比较 
		for(int i=0;i<9;i++){
			if(strcmp(chq,s3[i])==0){
				t=4;
				break;
			}
		}
	}
	line++;
	outtoken[0]=ch;
	outtoken[1]='\0';
	return;
} 
//输出函数,根据以上分析函数进行打印输出分析的结果
void show(){
	cout<<left;
	//setw(6)表示占位宽度为6个字符 
	if(t==7){
		cout<<setw(6)<<outtoken<<"			"<<setw(6)<<"ERROR!"<<setw(11)<<" "<<setw(10)<<"ERROR!";
	}else{
		cout<<left;
		cout<<setw(6)<<outtoken<<"			"<<"<"<<t<<","<<outtoken;
		cout<<setw(6-strlen(outtoken))<<">"<<"			";
		switch(t){
			case 1:cout<<left<<setw(10)<<"关键字";break;
			case 2:cout<<left<<setw(10)<<"分界符";break;
			case 3:cout<<left<<setw(10)<<"算术运算符";break;
			case 4:cout<<left<<setw(10)<<"关系运算符";break;
			case 5:cout<<left<<setw(10)<<"常数";break;
			case 6:cout<<left<<setw(10)<<"标识符";break;
		}
	} 
	cout<<endl;
} 
/*变量说明: 
k数组:关键字表; s数组:分界符表,其中分界符,算术运算符,关系运算符分别存放在s1,s2,s3数组中 
id:标识符; ci:常数 ;row:行 line:列,单词的位置 
instring数组:为输入源程序代码的单词缓存; outtoken数组:记录为输出内部表示缓存
 symbol:分析//后的注释;constant:常数分析;alphabet:标识符和关键字分析
analysis:分析函数,根据输入字符判断调用哪一个函数 ;show:输出打印函数
t:单词的种类 t=1:关键字 t=2:分界符 t=3:算术运算符 t=4:关系运算符 t=5:常数 t=6:标识符 t=7:出错*/

三、实验结果

测试一

测试二


 四、实验总结

        整体的代码思路是创建四个数组分别存放关键字表、界符表、运算符号表、关系运算符号表,这样若想新增符号只需要在数组中修改即可,实现动态变化而非写死的。

        下面进行模块化设计,总共分为analysis()、symbol()、constant()、alphabet()、show()、isnumber()、isalpha()七个函数,analysis函数作为总的分析函数,通过分析当前字符是否是字母还是数字或者其它符号,分别调用不同的函数进行具体的分析,然后将结果存储在全局变量outtoken和t中,前者代表输出的二元组,后者代表该单词的类型,难点在于两个符号的运算符的判断。

        本题还有一个细节之处,在输入完代码后敲的那个回车键会多余需要使用一个getchar()函数来吸收掉,并且结束符@为自定义的,不参与到词法分析中,所以在输入完程序代码后使用instring[p-1]='\0';//抵消掉@,这样就使得instring数组里存放的是完整的有效的程序代码,不含结束符。

END.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/559739.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于VSCODE的插件 一

官方API文档 1. 要学好TypeScript。 官方教程 1.1TypeScript是一门弱类型语言。 强类型和弱类型主要是站在变量类型处理的角度进行分类的。这些概念未经过严格定义&#xff0c;它们并不是属于语言本身固有的属性&#xff0c;而是编译器或解释器的行为。主要用以描述编程语言…

IT知识百科:三大云计算模型IAAS、PAAS、SAAS

引言 云计算已经成为现代IT架构的核心组成部分&#xff0c;而云服务模型是构建和交付云计算服务的关键概念。在云服务模型中&#xff0c;IAAS、PAAS和SAAS是最常见的三种模型。 本文将深入介绍这三种模型&#xff0c;探讨它们的特点、优势以及在不同场景下的适用性。 IAAS&am…

MySQL学习教程

目录 一、数据库操作 1.查看数据库版本号 2.创建数据库 3.查看指定的数据库 4.查看所有的数据库 5.删除指定的数据库 6.使用指定的数据库 7.数据库存储引擎介绍 二、数据库表说明 1.数据库表常见的列类型 2.数据库表的字段属性 三、数据库表操作 1.创建数据库表 2…

APlayer MetingJS 音乐播放器使用指南

文章目录 1.引用2.安装3.APlayer 原生用法4.MetingJS 的用法 1.引用 APlayer 是一个简洁漂亮、功能强大的 Html5 音乐播放器&#xff0c;GitHub地址&#xff1a;https://github.com/DIYgod/APlayer MetingJS 是为 APlayer 添加网易云、QQ音乐等支持的插件&#xff0c;GitHub地…

Servlet的使用与部署

目录 Servlet概念 创建一个Servlet程序 1、创建项目 2、导入依赖 3、创建目录 4、编写代码 5、打包程序 6、部署程序 7、验证程序 Servlet概念 Servlet 是一种实现动态页面的技术 . 是一组 Tomcat 提供给程序猿的 API, 帮助程序猿简单高效的开发一个 web app. S…

喜讯!热烈祝贺安科瑞DJSF1352-RN/D直流电能表取得UL证书

安科瑞虞佳豪 UL认证是由美国安全实验室&#xff08;Underwriters Laboratories&#xff09;提供的安全性认证服务。UL认证虽然不是强制的&#xff0c;但它是北美市场的保证&#xff0c;有UL标志的产品具有很高的市场认可度。 2安科瑞导轨式直流电能表 安科瑞导轨式直流电能…

visualgo学习与使用

前言&#xff1a;在反反复复学习数据结构和算法的过程中“邂逅”了visualgo----这款超级棒的学习网站。喜悦之情不亚于我以前玩前端时发现codepen时的快乐。 地址&#xff1a;https://visualgo.net/en visualgo是新加坡国立大学计算机学院一位很棒的博士老师Dr. Steven Halim …

基于M1芯片的Mac的k8s搭建

基础环境 centos8 macbook pro M1 vm vm安装centos8参考:MacBook M1芯片 安装Centos8 教程&#xff08;无界面安装&#xff09;_m1安装centos 8.4_Mr_温少的博客-CSDN博客 步骤 参考: MacOS M1芯片CentOS8部署搭建k8s集群_Liu_Shihao的博客-CSDN博客 所有机器前置配置 …

SSH登录和SSH免密登录

在了解ssh的时候产生了概念混淆&#xff0c;发现ssh登录和ssh免密登录是两码事。 可以从目的和过程对比这两个概念&#xff1a; 1.目的 1.1 SSH登录 简单来说就是&#xff1a;建立客户端和服务器之间安全的远程连接&#xff0c;登录远程服务器&#xff0c;以访问文件系统 。…

C语言——经典面试题

哈喽&#xff0c;大家好&#xff0c;今天我们来学习一道面试过程中可能会出现的一道笔试题 有这样一段代码&#xff0c;分析在VS编译器的运行结果 #include<stdio.h> int main() {int i 0;int arr[10] { 1,2,3,4,5,6,7,8,9,10 };for (i 0; i < 12; i){arr[i] 0;pr…

线性回归预测

目录 1、线性回归 2、R-Squared 1、线性回归 在机器学习和统计建模中&#xff0c;这种关系用于预测未来事件的结果 线性回归使用数据点之间的关系在所有数据点之间画一条直线 这条线可以用来预测未来的值 在机器学习中&#xff0c;预测未来非常重要。比如房价、股票等预测 …

Docker核心组件

Docker核心组件 -镜像 Docker Registry 镜像仓库 (Docker Registry) 负责存储、管理和分发镜像&#xff0c;并且提供了登录认证能力&#xff0c;建立了仓库的索引。 镜像仓库管理多个 Repository&#xff0c; Repository 通过命名来区分。每个 Repository 包含一个或多个镜像…

UI自动化测试用例管理平台搭建

用到的工具&#xff1a;python3 django2 mysql RabbitMQ celery selenium python3和selenium这个网上很多教程&#xff0c;我不在这一一说明&#xff1b; 平台功能介绍&#xff1a; 项目管理&#xff1a;用于管理项目。每个项目可以设置多个环境&#xff0c;例如开发环境…

winpcap 发包工具

本工具主要用来进行网络协议的调试&#xff0c;主要方法是&#xff0c;对现场数据抓包&#xff0c;然后将数据包带回交给开发人员&#xff0c;开发人员将该数据包重新发送和处理&#xff0c;模拟现场环境以便于调试和分析。 &#xff08;一&#xff09;使用方法 命令行下输入s…

linux0.12-10-chr_drv

[466页] 第10章 字符设备驱动程序 466–10-1-总体功能 466–10-1-1-终端驱动程序基本原理 467–10-1-2-Linux支持的终端设备类型 468–10-1-3-终端基本数据结构 472–10-1-4-规范模式和非规范模式 473–10-1-5-控制台终端和串行终端设备 476–10-1-6-终端驱动程序接口 476–…

【微信小程序】如何获取用户手机号授权登录

一. 前置条件 目前该接口针对非个人开发者&#xff0c;且完成了认证的小程序开放&#xff08;不包含海外主体&#xff09;&#xff0c;也就是说只针对企业认证小程序开放。若用户举报较多或被发现在不必要场景下使用&#xff0c;微信有权永久回收该小程序的该接口权限。在使用…

到底什么是CIDR(无类域间路由)?做网络的一定得懂这个术语!

CIDR&#xff08;无类域间路由&#xff09;是一种用于对互联网IP地址进行聚合和分配的技术。它通过改变IP地址的分配方式&#xff0c;有效地解决了IPv4地址空间不足的问题。 本文将详细介绍CIDR的原理、使用方法以及它对互联网的影响&#xff0c;还会针对CIDR出三道例题&#x…

使用SolVES 模型与多技术融合快速实现生态系统服务功能社会价值评估

生态系统服务是人类从自然界中获得的直接或间接惠益&#xff0c;可分为供给服务、文化服务、调节服务和支持服务4类&#xff0c;对提升人类福祉具有重大意义&#xff0c;且被视为连接社会与生态系统的桥梁。自从启动千年生态系统评估项目&#xff08;Millennium Ecosystem Asse…

金融学学习笔记第3章

第3章 管理财务健康状况和业绩 一、财务报表的功能 财务报表有三个重要的经济功能: (1)向公司的所有者和债权人提供关于公司目前状况及过去财务表现的信息。 (2)为所有者及债权人设定经营目标,对管理层施加限制提供了便捷的方式。 (3)为财务计划提供了方便的模式。 二、…

【马蹄集】第十二周作业

第十二周作业 目录 MT2056 二阶前缀和MT2057 门票MT2058 最大的平均值MT2068 高数考试MT2069 等差 MT2056 二阶前缀和 难度&#xff1a;黄金    时间限制&#xff1a;1秒    占用内存&#xff1a;128M 题目描述 在一个直角坐标系上&#xff0c;有 n n n 个坐标上有元素值&…