强大的ANTLR4(2)

news2025/1/18 10:50:52

每次在命令行里输入文本有点麻烦,可以将hello slb保存于hello.txt文本文件中,然后运行命令:

antlr4-parse Hello.g4 r -tokens hello.txt

出现如下内容:

[@0,0:4='hello',<'hello'>,1:0]
[@1,6:8='slb',<ID>,1:6]
[@2,9:8='<EOF>',<EOF>,1:9]

输出的是词法分析结果。几个术语:
token 词法符号
tokenizing 词法符号化
lexer 词法分析器
lexical analysis 词法分析

[@0,0:4='hello',<'hello'>,1:0]表示:
第0个词法符号,是'hello',从第0个字符到第4个字符,位于输入文本的第1行的第0个字符开始。

[@1,6:8='slb',<ID>,1:6]  表示:
第1个词法符号,是'slb',从第6个字符到第8个字符,类型是<ID>,位于输入文本的第1行的第6个字符开始。

识别一门语言,需要经过二个阶段,第一个阶段就是词法分析,第二个阶段是语法分析,生成一棵语法分析树。
在这里插入图片描述

下面是一个数组初始化的语法规则:

// file name: ArrayInit.g4
grammar ArrayInit;

init  : '{' value (',' value)* '}' ;  // 必须匹配至少一个value

value : init
      | INT
      ;

INT :   [0-9]+ ;             // 整数

WS  :   [ \t\r\n]+ -> skip ; 

运行下面的命令行,生成几个文件:

antlr4 -Dlanguage=Python3 ArrayInit.g4

1)ArrayInitParser.py
语法分析器类,每一条规则都对应一个方法,还有一些辅助代码。

2)ArrayInitLexer.py
词法分析器类

3)ArrayInitLexer.tokens
每个词法符号对应于一个数字形式的类型。

4)ArrayInitListener.py
在遍历语法分析树的时候,遍历器能够触发一系列“事件”,可以称为“回调函数”,通知我们提供的监听器对象。

试着解析一下所有的词法符号。

pygrun ArrayInit init --tokens
{99, 3, 451}
^Z
[@0,0:0='{',<1>,1:0]
[@1,1:2='99',<4>,1:1]
[@2,3:3=',',<2>,1:3]
[@3,5:5='3',<4>,1:5]
[@4,6:6=',',<2>,1:6]
[@5,8:10='451',<4>,1:8]
[@6,11:11='}',<3>,1:11]
[@7,13:12='<EOF>',<-1>,2:0]

打印语法分析树:

pygrun ArrayInit init --tree
{99, 3, 451}
^Z
(init {
   (value 99) ,
   (value 3) ,
   (value 451) })

用antlr4-parse也是类似的:

antlr4-parse ArrayInit.g4 init -tree
{99, 3, 451}
^Z
(init:1 { (value:2 99) , (value:2 3) , (value:2 451) })

它还支持-gui的命令行参数。
在这里插入图片描述
可以生成更复杂的嵌套数组的表示:

antlr4-parse ArrayInit.g4 init -gui
{1, {2, 3}, 4}
^Z

在这里插入图片描述

antlr4生成了一些python源代码,但要让python环境里能够解释它们,还需要安装一个东西:

pip install antlr4-python3-runtime

前面生成了一些类,但没有主程序,下面的链接里有书中相配套的Python源代码。
https://github.com/jszheng/py3antlr4book

我稍微修改了一下:

import sys
from antlr4 import *
from ArrayInitLexer import ArrayInitLexer
from ArrayInitParser import ArrayInitParser


istream = FileStream('input.txt')
lexer = ArrayInitLexer(istream)
stream = CommonTokenStream(lexer)
parser = ArrayInitParser(stream)
tree = parser.init()
print(tree.toStringTree(recog=parser))

现在,使用纯Python实现,我们也可以打印刚才的语法解析树了。

一个简单的翻译器

下面需要构造一个Listener来实现数字的翻译任务。
在这里插入图片描述

只需实现一个Listener,实现enter/exit方法,就可以实现轻松实现这种转换。

from ArrayInitListener import ArrayInitListener


class RewriteListener(ArrayInitListener):
    def enterInit(self, ctx):
        print('"', end='')

    def exitInit(self, ctx):
        print('"', end='')

    def enterValue(self, ctx):
        pass

    def exitValue(self, ctx):
        v = int(ctx.INT().getText())
        print(f'\\u{v:04x}', end='')

主程序也稍微增加了几行语句:

import sys
from antlr4 import *
from ArrayInitLexer import ArrayInitLexer
from ArrayInitParser import ArrayInitParser
from rewriter import RewriteListener

istream = FileStream("input.txt")
lexer = ArrayInitLexer(istream)
stream = CommonTokenStream(lexer)
parser = ArrayInitParser(stream)
tree = parser.init()
print(tree.toStringTree(recog=parser))

walker = ParseTreeWalker()
walker.walk(RewriteListener(), tree)
print()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/128542.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JDBC开荒

docker 创建MySQL 一、简介 Java DataBase Connectivity &#xff0c;是Java程序访问数据库的标准接口 Java访问DB的时候&#xff0c;并不是直接通过TCP连接的&#xff0c;而是通过JDBC接口&#xff0c;而JDBC接口又是通过JDBC驱动来访问的 JDBC是Java标准库自带的&#xff0…

(HP)next.js入门

推荐文档&#xff1a;生成<head> - 《next.js v7.0 中文文档》 - 书栈网 BookStack 1&#xff0c;解决的问题 SPA单页面应用的两个问题&#xff1a;首屏加载过慢&#xff0c;不能SEO(搜索引擎抓取&#xff09; 2&#xff0c;它是一个react服务端渲染框架 3&#xff0c;…

ArcGIS去除黑边方法汇总

概述 在使用ArcGIS对影像进行应用的时候&#xff0c;如果出现了黑边&#xff0c;除了影响美观之外&#xff0c;进行镶嵌处理也可能会有问题&#xff0c;这里&#xff0c;我们介绍一下几种ArcGIS去除黑边的方法&#xff0c;希望能够对大家有所帮助。 数据来源 教程所使用的实…

【C++进阶】类型转换

&#x1f387;C学习历程&#xff1a;入门 博客主页&#xff1a;一起去看日落吗持续分享博主的C学习历程博主的能力有限&#xff0c;出现错误希望大家不吝赐教分享给大家一句我很喜欢的话&#xff1a; 也许你现在做的事情&#xff0c;暂时看不到成果&#xff0c;但不要忘记&…

蓝桥杯Python练习题8-查找整数

资源限制   内存限制&#xff1a;256.0MB C/C时间限制&#xff1a;1.0s Java时间限制&#xff1a;3.0s Python时间限制&#xff1a;5.0s 问题描述   给出一个包含n个整数的数列&#xff0c;问整数a在数列中的第一次出现是第几个。 输入格式   第一行包含一个整数n。  …

欢迎谷歌回归中国,但有前提!李彦宏也发了条朋友圈

2018年&#xff0c;Google部分功能成功回归中国大陆 周一&#xff0c;人民日报在海外社交媒体平台Twitter和Facebook上刊文&#xff0c;针对谷歌计划以过滤版搜索引擎重返中国大陆的消息回应称&#xff0c;欢迎谷歌重返中国大陆&#xff0c;但前提是必须遵守中国法律。李彦宏在…

云计算IaaS、PaaS(iPaaS/aPaaS)以及SaaS以及发展趋势

一、云计算IaaS、PaaS以及SaaS架构 云计算涉及了很多产品与技术&#xff0c;表面上看起来的确有点纷繁复杂&#xff0c;但是云计算本身还是有迹可循和有理可依的&#xff0c;下面介绍一套云计算的架构&#xff0c;具体请看图&#xff1a; 上面这个云架构共分为服务和管理这两…

车载入侵检测与防御系统介绍

作者 | 田铮 上海控安可信软件创新研究院项目经理 来源 | 鉴源实验室 引言&#xff1a;上一篇文章&#xff08;智能网联汽车网络安全攻击与防御技术概述&#xff09;介绍了智能网联汽车中的网络安全攻击案例和具体攻击类型。而本篇文章中&#xff0c;我们将对汽车网络安全风险…

SpringSecurity——OAuth2框架鉴权实现源码分析

SpringSecurity——OAuth2框架鉴权实现源码分析一、ManagedFilter迭代过滤器链1.4 springSecurityFilterChain1.4.7 OAuth2AuthenticationProcessingFilter①.OAuth2AuthenticationProcessingFilter.class②.CookieTokenExtractor.class&#xff08;我们自己重写的方法&#xf…

瞄准智慧园区 东方恩拓与用友协同开拓新商机

在数字化转型升级浪潮中&#xff0c;传统园区也在寻求新的发展方向&#xff0c;从传统园区向智慧园区甚至未来园区不断演进。随着国家“数字中国”、“中国智造”、“新基建”等战略的部署&#xff0c;智慧园区也迎来了新的发展机遇&#xff0c;园区的数字化、网络化、智能化是…

户外运动耳机选择哪个、最适合户外运动的蓝牙耳机推荐

还有哪个季节比秋天更适合爬山和徒步等户外运动的吗&#xff1f;秋天—没有夏日的骄阳&#xff0c;没有冬天的万物凋零&#xff0c;放眼望去都是墨绿和金黄&#xff0c;上山的话还可以采摘成熟的各种各样的果子…但是一个人的话难免有些落寞&#xff0c;要是有音乐的陪伴则会增…

公网远程连接windows SQL Server数据库【内网穿透】

文章目录1. 本地安装配置SQL Server2. 将本地sqlserver服务暴露至公网2.1 本地安装cpolar内网穿透2.2 创建隧道3. 公网远程连接sqlserver3.1 使用命令行远程连接sqlserver3.2 使用navicat premium图形界面远程连接sqlserver3.3 使用SSMS图形界面远程连接sqlserver疫情当下,居家…

win7电脑怎么录屏?超级简单的2种电脑录屏方法

相信还有不少朋友的电脑系统是win7系统。其实&#xff0c;win7电脑和win10电脑一样都有自带录屏功能。那win7电脑怎么录屏&#xff1f;在win7电脑上开启运行窗口即可&#xff0c;当然也可以通过使用专业的录屏软件来录制屏幕。 下面就由小编给大家介绍一下2个win7电脑录屏的方…

P8 PyTorch WhereGather

前言 这两个函数优点是通过GPU 运算速度快 目录&#xff1a; 1 where 2 Gather 一 where 原理&#xff1a; torch.where(condition,x,y) 输入参数&#xff1a; condition: 判断条件 x,y: Tensor 返回值&#xff1a; 符合条件时: 取x, 不满足取y 优点&#xff1a; 可以使…

关注re:Invent中国巡展,尽享数字时代红利

编辑&#xff5c;阿冒收获固然很甜蜜&#xff0c;但是收获也很辛苦。肯定会有人感觉莫名其妙&#xff0c;既然是收获&#xff0c;必然是甜蜜的&#xff0c;哪来的辛苦啊&#xff1f;且不要着急&#xff0c;容我慢慢分说。一年一度的亚马逊云科技re:Invent全球大会&#xff0c;向…

【操作系统】磁盘调度算法

文章目录影响其访问的时间因素磁盘调度&#xff08;移臂调度&#xff09;常见的磁盘调度算法1、先来先服务算法&#xff08;FCFS&#xff09;2、最短寻道时间优先算法&#xff08;SSTF&#xff09;3、电梯调度算法&#xff08;扫描算法SCAN&#xff09;4、循环扫描算法&#xf…

Microsoft Office 2016 VOL版下载

链接都是VOL版&#xff0c;和零售版功能是一样的&#xff0c;只是激活方便一些&#xff0c;三个下载链接&#xff0c;第一个是Office就是包含了Word、Excel、PPT那些的&#xff0c;另外两个一个是Visio&#xff0c;一个是Project&#xff0c;如果不需要的话&#xff0c;只下载第…

【HTML5】复习(二)

HTML5复习二1.代码一2.代码二3.CSS的引入方式4.选择器5.form表单的一些属性6.内联7. 音频视频8. 滑块、搜索、数字、URL9. 表单补充1.代码一 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head>&…

声明式事务的属性之隔离级别

声明式事务的属性之隔离级别 ①介绍 数据库系统必须具有隔离并发运行各个事务的能力&#xff0c;使它们不会相互影响&#xff0c;避免各种并发问题。一个事务与其他事务隔离的程度称为隔离级别。SQL标准中规定了多种事务隔离级别&#xff0c;不同隔离级别对应不同的干扰程度&…

智能家居创意DIY之智能灯泡

一、什么是智能灯 传统的灯泡是通过手动打开和关闭开关来工作。有时&#xff0c;它们可以通过声控、触控、红外等方式进行控制&#xff0c;或者带有调光开关&#xff0c;让用户调暗或调亮灯光。 智能灯泡内置有芯片和通信模块&#xff0c;可与手机、家庭智能助手、或其他智能…