【PL理论深化】(2) 语法分析 (Syntax) | 编程语言的语法结构:文法 | 语义结构 (Sematics)

news2024/11/26 16:51:15

  • 💬 写在前面:编程语言是由归纳法生成的程序的集合。定义属于该语言的程序的形式的规则,即编写程序的规则,称为编程语言的 语法分析 (syntax) 而定义属于该语言的程序的意义的规则称为 语义结构(semantics)。这两者都是归纳定义的。

目录

0x00 语法分析(syntax analysis)

0x01 编程语言的语法结构:文法(grammar)

0x02 语义结构(Semantics)


0x00 语法分析(syntax analysis)

下面是一个由整数和四则运算符所构成的整数表达式集合,即整数表达式语言。

比如,以下整数表达式属于该语言中的程序:

.

像上述那样,程序通常用一维字符串来编写。

但实际上,计算机程序具有树形的二维结构,例如字符串:

我们将程序表示为树结构:

对应于图 (a) 的程序:

而对应于图 (b) 的程序,将用字符串编写的一维程序转换为二维树结构的技术 ——

称为 语法分析 (syntax analysis) 或 解析 (parsing) 。

(我们不会详细讨论语法结构分析的方法,而是着重于程序的结构如何呈现为树形)

0x01 编程语言的语法结构:文法(grammar)

假设程序的结构以树形结构明确给出,

整数表达式语言的语法结构可以通过以下推导规则归纳定义:

编程语言的语法结构通常采用 文法 (grammar) ,而不是推理规则来定义。

整数表达式语言的语法结构用文法表示如下:

上述规则表示有 5 种方法可以生成整数表达式。

根据第一条规则,任意整数 (n) 都可以是一个整数表达式。

而其余的规则意味着,对于任意两个整数表达式 E_1E_2

可以用四则运算符连接它们,从而创建一个新的整数表达式。

.

由于归纳规则的特性,通过这五种有限规则,可以生成无限多个任意的整数表达式。

例如,整数表达式 1+(2*(3-4)) 就是这样创建的:

如果将证明树的上下颠倒,并强调树的结构,就得到了图 (A) 。

像这样通过归纳定义的编程语言的语法结构,具有生成二维程序的规则。

.

为了将二维结构清晰地写成一维形式,只需适当地使用括号,例如表达为  1+(2*(3-4)) 。

0x02 语义结构(Semantics

如果语法结构是定义编程语言中程序外观的规则。

那么 语义结构 (semantics) 则是决定程序执行意义的规则。

程序的含义可以有多种定义,但对于整数表达式而言,

以计算表达式得到的整数值来定义其含义是最自然的。

我们可以这样表达:"计算整数表达式 E 得到整数 n " 或者 "整数表达式 E 的含义是 n "。

E\Rightarrow n

.

例如,1+(2*(3-4))\Rightarrow -1 表示程序 1+(2*(3-4)) 的含义是等于 −1。

这里的 \Rightarrow 表示一个关于程序和整数之间的二元关系。

换言之,若将程序的集合表示为 \mathbb P,整数的集合表示为 \mathbb Z

\Rightarrow 是 \mathbb P \times \mathbb Z 的一个子集 (即 \Rightarrow \subseteq \mathbb P \times \mathbb Z),它定义了整数表达式的语义结构。

对于整数表达式,可以通过以下推理规则来定义集合 \Rightarrow :

.

第一条规则 (E-Num) 对于任意整数 n,表示 (n,n) 是集合 \Rightarrow 的元素。

这里,整数 n 的意义被定义为整数值 n

第二条规则 (E-Plus) 表示如果 (E_1, n_1)(E_2,n_2) 是 \Rightarrow 的元素,

则 (E_1 + E_2, n_1+n_2) 也是 \Rightarrow 的元素,其余规则类似地定义。

.

然而,对于除法,定义限定 n2 不为零时才有意义。

例如,根据上述规则定义的集合 \Rightarrow 包含元素 \big((1+2)(3/3), 3\big) 。

整数表达式 (1+2)(3/3) 的含义被定义为 3。

可以证明 \big((1+2)*(3/3), 3\big)  是集合 \Rightarrow 的元素如下所示:

.

相对地,有些表达式可能看起来是正确的,但实际上可能没有定义。

例如,整数表达式 (3*4)/\big((1*2)-(1+1)\big) 对于任何整数 n

都无法通过推理规则 (3*4)/\big((1*2)-(1+1)\big) \Rightarrow n 进行证明。

.

因为整个表达式涉及除法,如果要证明它,就只能应用规则 \textrm{E-Div}

但在这种情况下,由于分母计算结果为 0,因此无法应用 \textrm{ E-Div} 规则。

这说明,并非所有通过编程语言的语法结构定义的程序都具有执行的实际意义。

即使通过了编译器的语法分析阶段,仍可能存在无法正确执行的程序!

.

到目前为止,我们已经从定义推理规则的角度定义了语义结构,

但是也可以直接从程序执行规则的角度解释这些规则。

例如,规则 \textrm{E-Plus} 描述了计算表达式 E_1 + E_2  的过程。

我们首先递归地计算表达式 E_1E_2 的值,得到 n_1n_2

然后定义为将这两个整数相加的过程。

通过这种方式解释语义结构,证明树的生成过程就成为程序执行的过程,

并且通过将语义结构定义为递归函数,我们可以直接获得编程语言的解释器 (interpreter) 。

📌 [ 笔者 ]   王亦优
📃 [ 更新 ]   2022.9.14
❌ [ 勘误 ]   /* 暂无 */
📜 [ 声明 ]   由于作者水平有限,本文有错误和不准确之处在所难免,
              本人也很想知道这些错误,恳望读者批评指正!

📜 参考资料 

- R. Neapolitan, Foundations of Algorithms (5th ed.), Jones & Bartlett, 2015.

- T. Cormen《算法导论》(第三版),麻省理工学院出版社,2009年。

- T. Roughgarden, Algorithms Illuminated, Part 1~3, Soundlikeyourself Publishing, 2018.

- J. Kleinberg&E. Tardos, Algorithm Design, Addison Wesley, 2005.

- R. Sedgewick&K. Wayne,《算法》(第四版),Addison-Wesley,2011

- S. Dasgupta,《算法》,McGraw-Hill教育出版社,2006。

- S. Baase&A. Van Gelder, Computer Algorithms: 设计与分析简介》,Addison Wesley,2000。

- E. Horowitz,《C语言中的数据结构基础》,计算机科学出版社,1993

- S. Skiena, The Algorithm Design Manual (2nd ed.), Springer, 2008.

- A. Aho, J. Hopcroft, and J. Ullman, Design and Analysis of Algorithms, Addison-Wesley, 1974.

- M. Weiss, Data Structure and Algorithm Analysis in C (2nd ed.), Pearson, 1997.

- A. Levitin, Introduction to the Design and Analysis of Algorithms, Addison Wesley, 2003. - A. Aho, J. Hopcroft, and J. Ullman, Data Structures and Algorithms, Addison-Wesley, 1983.

- E. Horowitz, S. Sahni and S. Rajasekaran, Computer Algorithms/C++, Computer Science Press, 1997.

- R. Sedgewick, Algorithms in C: 第1-4部分(第三版),Addison-Wesley,1998

- R. Sedgewick,《C语言中的算法》。第5部分(第3版),Addison-Wesley,2002

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1852112.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

学习笔记——路由网络基础——路由转发

六、路由转发 1、最长匹配原则 最长匹配原则 是支持IP路由的设备默认的路由查找方式(事实上几乎所有支持IP路由的设备都是这种查找方式)。当路由器收到一个IP数据包时,会将数据包的目的IP地址与自己本地路由表中的表项进行逐位(Bit-By-Bit)的逐位查找,…

HCIP--OSPF(笔记3)

OSPF扩展配置 手工认证 【1】接口认证 -- 直连的邻居间,设定认证口令,进行身份核实,同时对双方交互的数据进行加密保护 [r9-GigabitEthernet0/0/1]ospf authentication-mode md5 1 cipher 123456 邻居间认证模式、编号、密码必须完全一致 【…

【UML用户指南】-20-对基本行为建模-交互图

目录 1、概述 2、顺序图 2.1、两个不同于通信图的特征: 2.1.1、顺序图有对象生命线 2.1.2、顺序图有控制焦点 2.2、结构化控制 2.2.1、可选执行opt 2.2.2、条件执行alt 2.2.3、并行执行par 2.2.4、循环迭代执行loop 2.3、嵌套活动图 3、通信图 3.1、两…

Selenium WebDriver - 网络元素

本文翻译整理自:https://www.selenium.dev/documentation/webdriver/elements/ 文章目录 一、文件上传二、定位策略1、传统定位器2、创建定位器3、类名4、CSS选择器5、id6、NAME7、链接文本8、部分链接文本9、标签名称10、xpath11、相对定位器它是如何工作的可用相对…

java中Object和json相互转换的方式

1.org中jackson转换json,springboot中内置jackson ObjectMapper onew ObjectMapper(); List<>listnew ArrayList(); String jonso.writeAsValueString(list); 2.alibaba中fastjson转换成json GetMapping("/test")public TbUser testHttpClient(){String url…

Python 函数注解,给函数贴上小标签

目录 什么是函数注解? 为什么使用函数注解? 如何编写函数注解? 实战演练 与类型提示(Type Hints)的关系 类型安全的运算器 什么是函数注解? 函数注解(Function Annotations)是Python 3中新增的一个特性,它允许为函数的参数和返回值指定类型。 这些注解不会改变…

大学食堂管理系统

摘 要 随着信息技术的飞速发展和高校规模的不断扩大&#xff0c;大学食堂作为高校日常运营的重要组成部分&#xff0c;其管理效率和服务质量直接影响到师生的日常生活和学习。传统的食堂管理方式&#xff0c;如手工记录、纸质菜单、人工结算等&#xff0c;不仅效率低下&#x…

FFmpeg编译4

CPUx86-64 TOOLCHAIN N D K / t o o l c h a i n s / x 8 6 6 4 − 4.9 / p r e b u i l t / l i n u x − x 8 6 6 4 S Y S R O O T NDK/toolchains/x86_64-4.9/prebuilt/linux-x86_64 SYSROOT NDK/toolchains/x866​4−4.9/prebuilt/linux−x866​4SYSROOTNDK/platforms/and…

2024-06-23 操作系统实验5——模拟页式存储管理

文章目录 一、实验目的二、实验内容三、实验过程四、结果测试五、实验总结和说明 补录与分享本科实验&#xff0c;以示纪念。 一、实验目的 通过编写和调试请求页式存储管理的模拟程序以加深对请求页式存储管理方案的理解。 二、实验内容 页面淘汰算法可采用FIFO置换算法&a…

React+TS前台项目实战(十五)-- 全局常用组件Table封装

文章目录 前言Table组件1. 功能分析2. 代码详细注释3. 使用方式4. 效果展示 总结 前言 在这篇文章中&#xff0c;我们将对本系列项目中常用的表格组件Table进行自定义封装&#xff0c;以提高性能并适应项目需求。后期也可进行修改和扩展&#xff0c;以满足项目的需求。 Table组…

Windows 11 安装hp 1020 plus 打印机驱动 (Ubuntu 20.04.3 LTS 部署cups局域网共享打印服务器)

1 win11 下载HP laserjet 1020 plus驱动,可以官网下载哦 链接下载 2 手动添加hp laserjet 1020驱动: 控制面板-->查看设备和打印机-->打印机和扫描仪-->添加设备-->我需要的打印机不在列表中-->通过手动添加-->按名称选择共享打印机 如果找不到&#xff0…

论文《Tree Decomposed Graph Neural Network》笔记

【TDGNN】本文提出了一种树分解方法来解决不同层邻域之间的特征平滑问题&#xff0c;增加了网络层配置的灵活性。通过图扩散过程表征了多跳依赖性&#xff08;multi-hop dependency&#xff09;&#xff0c;构建了TDGNN模型&#xff0c;该模型可以灵活地结合大感受场的信息&…

简易部署的设备日志采集工具

永久免费: Gitee下载 最新版本 使用说明: Moretl 企业级采集文件工具 优势: A. 开箱即用. 解压直接运行.不需额外安装. B. 批管理设备. 设备配置均在后台管理. C. 无人值守 客户端自启动,自更新. D. 稳定安全. 架构简单,内存占用小,通过授权访问.

OPENCV中0x00007FFE5F35F39C发生异常

原因&#xff1a;读取图片时已经为灰度图像&#xff0c;又进行了一次灰度处理cvtColor 解决方法&#xff1a;如上图所示&#xff0c;将cv::imread的第二个参数改为cv::IMREAD_COLOR&#xff1b;或者保留cv::IMREAD_GRAYSCALE&#xff0c;删去后面的cv::cvtColor

高通安卓12-OTA 升级

1.OTA介绍 OTA 英文全称是 Over-the-Air Technology&#xff0c;即空间下载技术的意思。 OTA 升级是 Android 系统提供的标准软件升级方式。它功能强大&#xff0c;可以无损失升级系统&#xff0c;主 要通过网络[例如 WIFI、3G]自动下载 OTA 升级包、自动升级&#xff0c;但…

仿饿了么加入购物车旋转控件 - 自带闪转腾挪动画 的按钮

, mWidth - mCircleWidth, mHeight - mCircleWidth); canvas.drawRoundRect(rectF, mHintBgRoundValue, mHintBgRoundValue, mHintPaint); //前景文字 mHintPaint.setColor(mHintFgColor); // 计算Baseline绘制的起点X轴坐标 int baseX (int) (mWidth / 2 - mHintPaint.m…

新闻管理与推荐系统Python+Django+协同过滤推荐算法+管理系统

一、介绍 新闻管理与推荐系统。本系统使用Python作为主要开发语言开发的一个新闻管理与推荐的网站平台。 网站前端界面采用HTML、CSS、BootStrap等技术搭建界面。后端采用Django框架处理用户的逻辑请求&#xff0c;并将用户的相关行为数据保存在数据库中。通过Ajax技术实现前后…

mayavi pyqt 实例

目录 安装&#xff1a; 示例代码&#xff1a; 生成3d检测框&#xff1a; 安装&#xff1a; pip install pyqt5 mayavi traits traitsui 示例代码&#xff1a; import sys from PyQt5.QtWidgets import QApplication, QMainWindow, QVBoxLayout, QWidget, QPushButton from …

区块链中nonce是什么,什么作用

目录 区块链中nonce是什么,什么作用 区块链中nonce是什么,什么作用 Nonce在以太坊中是一个用于确保交易顺序性和唯一性的重要参数。以下是对Nonce的详细解释: 定义 Nonce是一个scalar值,它等于从该地址发送的交易数量,或在具有关联代码的账户的情况下,由该账户创建的合…

【Flutter 专题】112 图解自定义 ACEPieWidget 饼状图 (一)

类别选项球&#xff1b;切割绘制饼状图&#xff1b;饼状图中绘制文字&#xff1b; 1. 类别选项球 对于两侧不同颜色类别选项卡&#xff0c;仅需要简单设置一下 Container 的 decoration 装饰器即可&#xff0c;只是方便用户查看饼状图分类而已&#xff1b; return Container…