Java高级——Graal编译器介绍

news2025/1/12 20:48:07

Graal编译器介绍

Graal编译器由Java实现,支持提前编译和即时编译

JDK9推出Java虚拟机编译器接口(Java-Level JVM CompilerInterface,JVMCI),将Graal从HotSpot代码中独立出来(即可外部挂载)

构建编译调试环境

这里大坑,试了很多个版本都报错,文件放置在自己的Home下,不要放在奇奇怪怪的目录,保持同一个用户,否则可能会有权限问题!!!

下载构建工具mx

git clone https://github.com/graalvm/mx.git
git checkout 5.247.4

下载Graal编译器代码

git clone https://github.com/oracle/graal.git
git checkout release/graal-vm/19.3

使用带JVMCI的JDK 1.8,可在如下网站下载

https://github.com/graalvm/openjdk8-jvmci-builder/releases

Python版本如下

在这里插入图片描述

配置编译环境,将mx添加到环境变量,指定编译使用的JDK

export PATH=$PATH:/home/song/mx
export JAVA_HOME=/home/song/Downloads/jdk1.8

编译,无报错即编译成功

cd graal/compiler
mx build

编译完成后构建为Eclipse项目

cd graal/compiler
mx eclipseinit

下载Eclipse安装,修改eclipse.ini设置最大堆为2G

在这里插入图片描述

启动Eclipse,将编译graal的JDK设置为默认,Window-Java-installed JREs,删除原来的,点击add-Standard VM-Diectory选择存放目录会自动识别

在这里插入图片描述

在installed JREs下面的Execution Enviroments选择对应JDK并打勾

在这里插入图片描述

在Java-Compiler选择对应JDK

在这里插入图片描述

File-Import-General-Existing Projects into Workspace选择graal根目录导入项目

在这里插入图片描述

项目有报错但不影响下面步骤

JVMCI编译器接口

JVMCICompiler接口如下,除了接收字节码之外,还有方法的局部变量槽个数、操作数栈深度等信息

interface JVMCICompiler {
	void compileMethod(CompilationRequest request);
}

interface CompilationRequest {
	JavaMethod getMethod();
}

interface JavaMethod {
	byte[] getCode();
	int getMaxLocals();
	int getMaxStackSize();
	ProfilingInfo getProfilingInfo();
	... // 省略其他方法
}

通过继承关系,可看到HotSpotGraalCompiler实现了JVMCI

在这里插入图片描述

对于如下程序

public class Demo {

	public static void main(String[] args) {
		while (true) {
			workload(14, 2);
		}
	}
	
	private static int workload(int a, int b) {
		return a + b;
	}
}

先使用分层编译,添加虚拟机参数

-XX:+PrintCompilation -XX:CompileOnly=Demo::workload

可看到wordload()方法被分层编译了多次,“made not entrant”的输出就表示了方法的某个已编译版本被丢弃过

在这里插入图片描述

若只使用graal编译器运行,添加如下参数

-Djvmci.class.path.append=/home/song/graal/compiler/mxbuild/dists/jdk1.8/graal.jar:/home/song/graal/sdk/mxbuild/dists/jdk1.8/graal-sdk.jar
-XX:+UnlockExperimentalVMOptions
-XX:+EnableJVMCI
-XX:+UseJVMCICompiler
-XX:-TieredCompilation
-XX:+PrintCompilation
-XX:CompileOnly=Demo::workload

为了验证结果,修改HotSpotGraalCompiler类的compileMethod()方法,输出编译的方法名称和编译耗时

public CompilationRequestResult compileMethod(CompilationRequest request) {
	long time = System.currentTimeMillis();
	CompilationRequestResult result = compileMethod(request, true, graalRuntime.getOptions());
	System.out.println("compile method:" + request.getMethod().getName());
	System.out.println("time used:" + (System.currentTimeMillis() - time));
	return result;
}

运行代码,可看到对应输出

在这里插入图片描述

代码中间表示

Graal采用理想图作为中间表示,其是有向图,节点表示程序的元素,边表示数据或控制流,对如下程序

public class Demo {

	public static void main(String[] args) {
		while (true) {
			workload(14, 2);
		}
	}
	
	static int workload(int a, int b) {
		return (a + b) * (a + b);
	}
}

添加参数-Dgraal.Dump输出理想图

-Djvmci.class.path.append=/home/song/graal/compiler/mxbuild/dists/jdk1.8/graal.jar:/home/song/graal/sdk/mxbuild/dists/jdk1.8/graal-sdk.jar
-XX:+UnlockExperimentalVMOptions
-XX:+EnableJVMCI
-XX:+UseJVMCICompiler
-XX:-TieredCompilation
-XX:+PrintCompilation
-XX:CompileOnly=Demo::workload
-Dgraal.Dump

可看到类似输出

在这里插入图片描述

在如下地址下载Ideal Graph Visualizer

https://www.oracle.com/technetwork/graalvm/downloads/index.html

修改idealgraphvisualizer/etc/idealgraphvisualizer.conf配置JDK

在这里插入图片描述

通过./idealgraphvisualizer/bin/idealgraphvisualizer打开软件,打开上面生成的文件

在这里插入图片描述
如上,参数的加法操作只进行了一次,然后流出两条数据流到乘法操作的输入中,说明产生了公共子表达式消除,而对于如下程序

public class Demo {
    private static int A;
    private static int B;

    public static void main(String[] args) {
        while (true) {
            workload();
        }
    }

    static int workload() {
        return (getA() + getB()) * (getA() + getB());
    }

    public static int getA() {
        return A;
    }

    public static int getB() {
        return B;
    }

}

getA()和getB()方法内部逻辑不确定的,只能在内联之后才能考虑进一步的优化措施,函数调用时无法实现公共子表达式消除,如下进行了4次调用方法、2次加法、1次乘法

在这里插入图片描述

代码优化

生成理想图的函数为greateGraph(),其数据结构为ValueNode子类节点集合,转换到理想图过程被封装在BytecodeParser类,

以BytecodeParser::genArithmeticOp()中的iadd操作为例,先出栈2个操作数,通过genIntegerAdd()相加再入栈

在这里插入图片描述

过程由AddNode节点表示,代码如下

protected ValueNode genIntegerAdd(ValueNode x, ValueNode y) {
	return AddNode.create(x, y, NodeView.DEFAULT);
}

如下,AddNode在创建节点时调用canonical(),在其中优化缩减理想图(即代码优化),如进行了

  • 算术聚合(如将(a+1)+2聚合为a+3)
  • 符号合并(如将(a-b)+b合并为a)等操作
public static ValueNode create(ValueNode x, ValueNode y, NodeView view) {
	BinaryOp<Add> op = ArithmeticOpTable.forStamp(x.stamp(view)).getAdd();
	Stamp stamp = op.foldStamp(x.stamp(view), y.stamp(view));
	ConstantNode tryConstantFold = tryConstantFold(op, x, y, stamp, view);
	if (tryConstantFold != null) {
		return tryConstantFold;
	}
	if (x.isConstant() && !y.isConstant()) {
		return canonical(null, op, y, x, view);
	} else {
		return canonical(null, op, x, y, view);
	}
}

而公众子表达式消除实现在tryGlobalValueNumbering()方法中,若发现了可以进行消除的算术子表达式,则找出重复的节点替换、删除,如下

public boolean tryGlobalValueNumbering(Node node, NodeClass<?> nodeClass) {
	if (nodeClass.valueNumberable()) {
		Node newNode = node.graph().findDuplicate(node);
		if (newNode != null) {
			assert !(node instanceof FixedNode || newNode instanceof FixedNode);
			node.replaceAtUsagesAndDelete(newNode);
			COUNTER_GLOBAL_VALUE_NUMBERING_HITS.increment(debug);
			debug.log("GVN applied and new node is %1s", newNode);
			return true;
		}
	}
	return false;
}

机器码生成

先生成低级中间表示(LIR,与具体机器指令集相关的中间表示),再由HotSpot产生机器码,对如下程序

public class Demo {

	public static void main(String[] args) {
		while (true) {
			workload(14, 2);
		}
	}
	
	static int workload(int a, int b) {
		return a+b;
	}
}

添加虚拟机参数

-Djvmci.class.path.append=/home/song/graal/compiler/mxbuild/dists/jdk1.8/graal.jar:/home/song/graal/sdk/mxbuild/dists/jdk1.8/graal-sdk.jar
-XX:+UnlockExperimentalVMOptions
-XX:+EnableJVMCI
-XX:+UseJVMCICompiler
-XX:-TieredCompilation
-XX:+PrintAssembly
-XX:CompileOnly=Demo::workload
-XX:+DebugNonSafepoints

从下面地址下载hsdis-amd64.so放到$JAVA_HOME/lib/amd64

https://github.com/cmuramoto/hsdis

编译生成汇编如下

在这里插入图片描述

加法操作在AddNode::generate()中调用ArithmeticLIRGeneratorTool的emitAdd()方法生成机器码,将其改为emitSub

在这里插入图片描述

可看到对应汇编变成了sub

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/74856.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Klarf 文件可视化工具

1.技术框架 1.1 前端&#xff1a; Vue3 网页版Electron Quasar 可生成 EXE、APK 等客户端Element-Plus 控件axios 跨域 1.2 后端&#xff1a; Flask 提供接口 2. Web 版和客户端版 2.1 Web 版页面 2.2 客户端界面 2.3 使用流程 在 SenseTools-Klarf-Parser/data/test_f…

小程序开发,低成本运营教程

近年来&#xff0c;小程序DAU呈现出爆发式增长的趋势&#xff0c;相比app来说它具有一定的优势&#xff0c;不占用手机内存&#xff0c;在应用内就可使用&#xff0c;对用户来说非常便利。 另外&#xff0c;由于小程序的开发门槛和成本都比较低&#xff0c;企业还能依托平台获…

ImmunoChemistry丨ICT艾美捷ELISA平板盖说明书

使用ImmunoChemistry艾美捷ELISA平板盖减少样品蒸发并防止免疫测定培养期间的污染。ELISA平板盖是透明的粘性塑料片&#xff0c;用于在培养分析时覆盖和密封微量滴定板孔。 ImmunoChemistry Technologies简称"ICT",研究工具众多&#xff0c;包含细胞蛋白酶、细胞凋亡…

【MyBatis】订单商品数据模型分析

1. 数据模型分析思路 每张表记录的数据内容 分模块对每张表记录的内容进行熟悉&#xff0c;相当于你学习系统需求&#xff08;功能&#xff09;的过程。 每张表重要的字段设置 非空字段、外键字段 数据库级别表与表之间的关系 外键关系 表与表之间的业务关系 在分析表与表之…

【环境配置】使用Docker搭建LAMP环境

这篇文章不是介绍DOCKER是什么&#xff0c;也不是阐述DOCKER的核心&#xff1a;镜像/容器和仓库之间的关系,它只是一篇让刚刚接触DOCKER的初学者&#xff0c;在没有完全了解DOCKER是什么之前,也能尽快的在Linux系统下面通过DOCKER来搭建一个LAMP环境&#xff0c;这是其一&#…

【代码审计-PHP】基于Thinkphp框架开发的

目录 一、Thinkphp基本结构 1、框架目录 2、判断框架、版本 3、入口文件 4、资源文件 5、调试开关 6、URL路由 二、基本函数 1、请求 2、交互&#xff1a; 3、响应&#xff1a; 三、危险函数 四、已有漏洞 五、漏洞检测工具 六、工具 一、Thinkphp基本结构 1、框…

Django笔记

Cookie中的数据是由键值对构成&#xff0c;每一个cookie就是一个键值对&#xff1b;Cookie拥有有效期&#xff1a; max_age&#xff08;单位是秒&#xff09;就用来决定 Cookie 的有效期&#xff1b;path决定Cookie的有效范围&#xff08;当path为"/"时&#xff0c;即…

跟我学Python图像处理丨带你入门OpenGL

摘要&#xff1a;介绍Python和OpenGL的入门知识&#xff0c;包括安装、语法、基本图形绘制等。本文分享自华为云社区《[Python图像处理] 二十七.OpenGL入门及绘制基本图形&#xff08;一&#xff09;》&#xff0c;作者&#xff1a;eastmount。 一.OpenGL入门知识 1.什么是Op…

冬季,该如何对扬尘进行管理?

冬季降水少&#xff0c;大风天气多&#xff0c;如今随着各个城市的全面放开&#xff0c;城区里面车辆来来往往更多&#xff0c;所以非常容易产生道路扬尘污染。扬尘污染不仅会降低空气质量&#xff0c;影响居民的正常出行&#xff0c;而且还会对人们的身体尤其是呼吸系统产生健…

Java 注解(Annotation)(上)

Java 注解&#xff08;Annotation&#xff09; Java 语言中的类、方法、变量、参数和包等都可以被标注。和 Javadoc 不同&#xff0c;Java 标注可以通过反射获取标注内容。在编译器生成类文件时&#xff0c;标注可以被嵌入到字节码中。Java 虚拟机可以保留标注内容&#xff0c…

设计模式,究竟有着怎样的力量?(初读修言老师设计模式)

每一个模式描述了一个在我们周围不断重复发生的问题&#xff0c;以及该问题的解决方案的核心。这样&#xff0c;你就能一次又一次地使用该方案而不必做重复劳动。 —— Christopher Alexander 设计模式是“拿来主义”在软件领域的贯彻实践。和很多人的主观臆断相反&#xff0c;…

HBase的Region Split详解

什么是Region Split region split是hbases水平扩展一个重要因素。随着数据的不断写入&#xff0c;将一个region切分为两个小region&#xff0c;并将切分后的region放在不同的节点上&#xff0c;以达到将负载进行均衡到其他节点。 Region Split的流程 在zookeeper的/hbase/regio…

从股票市场选择配对的股票:共同趋势协整模型

让我们回忆一下共同趋势模型。给定两个时间序列和&#xff0c;我们有 其 中和是随机游走&#xff0c;即非平稳部分&#xff0c;或者说共同趋势部分(common trends)。以及是平稳的部分&#xff0c;即特定部分&#xff08;specific component&#xff09;。如果两个时间序列是协整…

归并排序应用——剑指 Offer 51. 数组中的逆序对

文章目录题目1.错误示范2. 分析逆序对的判断统计出某个数后面有多少个数比它小举例(完整过程解析)第一次循环第二次循环第三次循环第四次循环第五次循环循环结束的两种存在情况3. 正确代码4.递归展开图题目 1.在数组中的两个数字&#xff0c;如果前面一个数字大于后面的数字&am…

全球发展,布局城市核心区域,放眼世界看郁锦香酒店有多百变

随着消费需求的不断升级&#xff0c;酒店消费场景也进行着多元化的发展&#xff0c;城市高端度假品牌正积极溯源消费需求&#xff0c;寻得品牌文化延伸的可靠路径。同时&#xff0c;各大酒店品牌也加快在市场布局的脚步&#xff0c;希望通过布局城市核心区域获得可持续发展的更…

鸿蒙所谓的软总线

鸿蒙网上资料 分布式软总线组件 简介 由于设备通信方式多种多样(WIFI、蓝牙等)&#xff0c;不同通信方式使用差异大&#xff0c;问题多。同时通信链路的融合共享和冲突无法处理。分布式软总线实现近场设备间统一的分布式通信能力管理&#xff0c;提供不区分链路的设备发现连…

IFR202型红外雨量传感器

IFR202型红外雨量传感器是专用于测量降雨量的仪器&#xff0c;拥有知识产权&#xff0c;采用光学扫描原理&#xff0c;实现雨滴大小及雨滴数量的实时扫描&#xff0c;进而计算出降雨量输出。支持脉冲输出与RS232输出当使用脉冲输出功能时&#xff0c;可以完全替代翻斗式雨量计。…

【电巢】三星核心供应商名单公布,删除京东方新增13家(附103家厂商名录)

前言 11月30日&#xff0c;据韩媒The ELEC报道&#xff0c;三星在最新公布的「供应商名单」中&#xff0c;悄然删除了国内企业京东方、群创&#xff0c;以及日企阿尔卑斯电气、日东电工、罗姆等10家企业&#xff0c;同时&#xff0c;新增了舜宇光学、Simmtech等13家企业。 以下…

Self-Attention 、 Multi-Head Attention 、VIT 学习记录及源码分享

这里写目录标题1 参考资料2 重点记录2.1 Self-Attention2.2 Multi-Head Attention3. Vision Transformer(VIT)3.1 纯VIT3.2 Hybrid VIT4 代码使用前言&#xff1a;想要看懂VIT中的一些内容&#xff0c;需要的基础知识点就是自己跑过一些CV方向的Demo&#xff0c;知道常见CV领域…

ADI Blackfin DSP处理器-BF533的开发详解13:LDF内存分配的详解(含源代码)

硬件准备 ADSP-EDU-BF533&#xff1a;BF533开发板 AD-HP530ICE&#xff1a;ADI DSP仿真器 软件准备 Visual DSP软件 硬件链接 功能介绍 ADSP上的LDF&#xff08;Linker Description Files&#xff09;连接器描述文件是处理器用来进行资源分配的文件&#xff0c;通过对LDF文…