在亚马逊云科技上利用Graviton4代芯片构建高性能Java应用(上篇)

news2025/1/23 4:05:07

简介

在AI迅猛发展的时代,芯片算力对于模型性能起到了至关重要的作用。一款能够同时兼具高性能和低成本的芯片,能够帮助开发者快速构建性能稳定的生成式AI应用,同时降低开发成本。今天小李哥将介绍亚马逊推出的4代高性能计算处理器Gravition,带大家了解如何利用Graviton芯片为Java生成式AI应用提高性能、优化成本。

本篇文章将介绍如何在云平台上创建Graviton芯片服务器,并在Graviton芯片服务器上安装Java应用,并对比Java应用在Graviton和Intel芯片服务器上的运行性能。在本系列下篇中,我们将利用Graviton芯片部署Java容器应用,比较不同芯片服务器上的容器应用性能,并查看、分析测试结果。

方案所需基础知识

什么是Graviton4代芯片?

Amazon Graviton 4 处理器由亚马逊云科技定制设计的第四代高性能、低功耗处理器,旨在为 Amazon 计算服务中的工作负载提供最佳性价比,相对于传统计算类工作负载(Graviton2)提供高达40%的性价比提升。与常见的 x86 处理器相比,基于 Graviton 4 的 EC2 实例具有以下特性:

  • 每个 vCPU 独占一个物理核心的计算资源,而非通过 SMT 技术获得一个线程;
  • 每个 vCPU 拥有更大的 L1/L2 Cache 容量;
  • 更快的内存带宽和更低的内存延时。
  • Graviton 处理器支持众多 Linux 操作系统,包括 Red Hat Enterprise Linux、SUSE 和 Ubuntu 等。
  • Graviton 兼容众多云原生服务和开源软件,兼容亚马逊云科技上的开发工具,数据库,容器,分析,无服务器等服务,拥有丰富的应用生态。

最新发布的第 4 代 Graviton 处理器(基于 Arm Neoverse-V2,ARMv9.0-a);主频提升,L2 缓存翻倍,L3 缓存容量提升,支持 SVE2; 内存:12*DDR5-5600(前代采用 8*DDR5-4800),内存带宽提升 75%;

本实践包括的内容

1. 在亚马逊云科技上分别创建x86芯片以及Graviton4芯片的服务器

2. 在服务器中启动并运行java程序

3. 对比Java程序在两种芯片服务器上的运行性能

项目实操步骤 

创建Graviton4芯片服务器

1. 首先我们进入亚马逊云科技控制台,进入EC2服务

2. 点击Launch Instance创建一台EC2服务器

3. 在芯片架构处,我们选择实例类型为r8g.xlarge(4vCPU和32GiB内存)实例用于创建Graviton4芯片服务器。另外我们还需要创建一个r6i.xlarge实例,实例用于创建Intel x86芯片服务器。

4.创建SSH登录秘钥对

5. 为密钥对命名,并选择pem类型,点击右下角创建。

6. 运行以下命令为密钥对授权,用于SSH登录服务器

chmod 400 test-only.pem

7. 为EC2服务器添加VPC和子网配置

8. 选择配置防火墙安全组,在防火墙入站规则中添加允许SSH从0.0.0.0/0 IP范围访问

9.并选择服务器存储,我们选择gp3类型的80GiB的磁盘存储。

通过SSH连接进入服务器

10. 通过以下命令SSH登录到EC2服务器中,将创建好的EC2服务器IP地址替换到命令中“EC2实例公网 IP 地址”字段

ssh -i /path/key-pair-name.pem ec2-user@EC2实例公网 IP 地址

开始部署Java应用程序 

11. 通过 SSH 进入Graviton4芯片/intel芯片服务器,通过下面命令运行 Demo 程序。在下面的命令中我们安装了Java11版本,并设置系统语言可现实中文,下载Java应用的安装包和启动脚本,最后运行该程序。

## 安装 JDK
sudo su - root
yum install java-11-amazon-corretto -y

## 设置系统语言环境可显示中文
localedef -i zh_CN -f UTF-8 zh_CN.UTF-8
export LANG=zh_CN.UTF-8
export LC_CTYPE=zh_CN.UTF-8

## 下载 Demo 程序(Java 语言的 Jar 包)和运行脚本
wget https://github.com/eric-yq/ec2-test-suite/raw/main/blowfish-demo/unitTest-1.0-SNAPSHOT.jar
wget https://github.com/eric-yq/ec2-test-suite/raw/main/blowfish-demo/run.sh

## 运行脚本并等待实验完成, $(nproc) 表示 Demo 程序并行运行的数量和实例 vCPU 数相同。
bash run.sh $(nproc)

12. 我们可以得到下方左侧的输出,显示程序启动在Graviton4服务器上总耗时为13.536秒,在Intel芯片上总耗时为15.198秒。

13. 我们重新配置Java应用程序的进程启动Demo数量(1-4,对应服务器的1-4个vCPU),分别记录启动1-4个Demo数量的对应启动时间,得到以下表格。

IDDemo 并行数CPU 利用率c7g.xlarge 平均完成时间 c7g.xlargec6i.xlarge 平均完成时间
1125%12.811.0
2250%12.811.4
3375%13.113.4
44100%13.515.2

 14. 我们根据以上数据绘制折线趋势图,我们观察到对于相同大小的 X86 和 Graviton服务器,随着并行进程数量上升,在Demo并行数量大于2时,Graviton4芯片服务器的性能大幅上升,程序启动时间减少。

总结结论

15. 根据上述数据,我们可以得到以下结论:

  • 本实验在相同大小(4 vCPU)的不同X86 和 Graviton4芯片实例,都可以顺利运行相同的Java程序,说明使用Java语言开发的程序无需任何修改即可直接在Graviton服务器上运行,Graviton的可移植性和兼容性都很好。
  • Graviton实例的每个vCPU即为一个物理核心,X86实例的每个vCPU是一个物理核心通过 SMT技术虚拟出的一个超线程
  • 当并行Java进程数目为1和 2(分别对应 CPU 利用率 25% 和 50%)时,X86服务器性能(单核)较好,完成时间较短。
  • 当并行Java进程数目上升为 3 和 4 时(分别对应 CPU 利用率 75% 和 100%)时,X86 服务器性能衰减严重,应用启动时间大幅上升。与之行程对比的是,Graviton4服务器性能相对稳定,并明显优于 X86服务器。

以上就是利用亚马逊云科技自研Graviton4代芯片构建高性能、低成本的Java应用程序的上篇内容。欢迎大家关注小李哥和我的亚马逊云科技AI服务深入调研系列,不要错过未来更多国际前沿的AWS云开发/云架构方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2114523.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Python 千题 —— 算法篇】无重复字符最长子段

Python 千题持续更新中 …… 脑图地址 👉:⭐https://twilight-fanyi.gitee.io/mind-map/Python千题.html⭐ 题目背景 在编程过程中,处理字符串的任务时常遇到,其中一个经典问题是查找无重复字符的最长子串。这在很多应用场景中…

Linux网络测试和故障排查命令

文章目录 ping 命令常用选项:使用示例:域名解析和 IP 地址响应数据停止 ping 命令统计数据延迟统计 traceroute 命令常用选项:使用示例:命令执行:路由节点详情: mtr 命令使用示例:使用结果详解输…

【持续更新】Adoobe Acroobat Pro DC 2024 (v24.3.20054)最新修改版

Adoobe Acroobat Pro DC 拥有智能工具,为您的沟通能力增添更多力量。使用包含丰富媒体元素的PDF文件进行创建与编辑,更加安全地分享信息,并且更高效地收集反馈意见。这款先进的软件程序是商务专业人士的理想选择,能够创建、合并、…

jmeter之ForEach控制器使用

ForEach控制器作用: 一般和用户自定义变量或者正则表达式提取器配合使用,读取返回结果中一系列相关的变量值,该控制器下的取样器都会被执行一次或多次,每次读取不同的变量值(类似python当中的for语句,用来遍历操作) 本节代码已上…

Spring6详细学习笔记(IOC+AOP)

一、Spring系统架构介绍 1.1、定义 Spring是一个轻量级的控制反转(IoC)和面向切面(AOP)的容器(框架)。Spring官网 Spring是一款主流的Java EE 轻量级开源框架,目的是用于简化Java企业级引用的开发难度和开发周期。从简单性、可测试性和松耦…

Qt-常用控件(3)-输入类

1. QLineEdit QLineEdit 用来表示单行输入框.可以输入一段文本,但是不能换行 核心属性 属性说明text输入框中的文本inputMask输入内容格式约束maxLength最大长度frame是否添加边框echoMode显示方式. QLineEdit::Normal :这是默认值,文本框会显示输入的文本。QLineE…

物联网之流水LED灯、正常流水灯、反复流水灯、移动流水灯

MENU 硬件电路设计软件程序设计正常流水LED灯反复流水LED灯移动流水LED灯 硬件电路设计 材料名称数量直插式LED1kΩ电阻杜邦线(跳线)若干面包板1 每一个LED的正极与开发板一个GPIO引脚相连,并串联一个电阻,负极接GND。 当然也可以选择只使用一个电阻。 软…

DELTA_IA-ASD_ASDA-A2简明教程

该文章仅供参考,编写人不对任何实验设备、人员及测量结果负责!!! 0 引言 文章主要介绍电机的硬件连接、软件配置、转动调试以及软件控制。文章中提到的内容在产品手册中都有说明,强烈建议在操作前通读产品手册&#…

1-17 平滑处理——中值滤波 opencv树莓派4B 入门系列笔记

目录 一、提前准备 二、代码详解 cv2.medianBlur函数用于对图像进行中值滤波。中值滤波是一种去噪声的技术,可以有效地去除图像中的盐和胡椒噪声。函数的两个参数如下: 三、运行现象 四、完整代码贴出 一、提前准备 1、树莓派4B 及 64位系统 2、提前…

【2024 版】最新 kali linux 入门及常用简单工具介绍(非常详细)

一、介绍 kali Linux Kali Linux 是一个基于 Debian 的 Linux 发行版,主要用于数字取证和渗透测试。它预装了大量的安全审计和渗透测试工具,被广泛应用于网络安全领域。 (一)特点 工具丰富:集成了数百种用于渗透测试…

华为eNSP:NAT Server(端口映射)

一、拓扑图 二、配置过程 此处省略设备地址以及路由配置过程 1、服务器开启ftp服务 2、路由器配置nat server [r4]int g0/0/2#进入流量出接口 [r4-GigabitEthernet0/0/2]nat server protocol tcp global 192.168.3.11 ftp inside 192.168.2.1 ftp# …

Java数组(详解版)

数组的定义: 什么是数组: 数组:可以看成是相同类型元素的一个集合。在内存中是一段连续的空间。 1. 数组中存放的元素其类型相同 2. 数组的空间是连在一起的 3. 每个空间有自己的编号,其实位置的编号为 0 ,即数组…

Nuxt3入门:过渡效果(第5节)

你好同学&#xff0c;我是沐爸&#xff0c;欢迎点赞、收藏、评论和关注。 Nuxt 利用 Vue 的 <Transition> 组件在页面和布局之间应用过渡效果。 一、页面过渡效果 你可以启用页面过渡效果&#xff0c;以便对所有页面应用自动过渡效果。 nuxt.config.js export defaul…

冒泡排序——基于Java的实现

简介 冒泡排序&#xff08;Bubble Sort&#xff09;是一种简单的排序算法&#xff0c;适用于小规模数据集。其基本思想是通过重复遍历待排序的数组&#xff0c;比较相邻的元素并交换它们的位置&#xff0c;以此将较大的元素逐步“冒泡”到数组的末尾。算法的名称源于其运行过程…

动手学习RAG: 向量模型

在世界百年未有之变局与个人自暴自弃的间隙中&#xff0c;我们学一点RAG。 RAG是一种独特的应用&#xff0c;“一周写demo&#xff0c;优化搞半年”&#xff0c;我甚至听说它能破解幻术。 为了理解其优化中的关键一环&#xff0c;我们先看下文本向量。文本向量除了是RAG检索的…

# 键盘字母上有下标数字,输入时怎么一键去掉,关闭键盘上的下标数字。‌

键盘字母上有下标数字&#xff0c;输入时怎么一键去掉&#xff0c;关闭键盘上的下标数字。‌ 一、问题描述&#xff1a; 如下图&#xff0c;有的笔记本电脑键盘上&#xff0c;没有数字小键盘&#xff0c;数字小键盘会和字母混和在一起&#xff0c;这样打字时&#xff0c;不容…

AI在医学领域:MASL多模态辅助诊断声带麻痹

声带麻痹&#xff08;Vocal Cord Paralysis, VP&#xff09;&#xff0c;也称为喉瘫痪&#xff0c;是指由于支配声带的神经受损导致声带运动障碍的疾病。这种状况可以是单侧或双侧的&#xff0c;通常由脑部、颈部、胸部的肿瘤、外伤、炎症&#xff0c;以及各种全身疾病引起。这…

复数随机变量(信号)的方差和协方差矩阵的计算

怎么计算复数随机变量的方差和协方差矩阵&#xff1f; 使得其与MATLAB中var函数和cov函数的结果一致。 前言 复信号在信号处理中随处可见&#xff0c;关于复信号&#xff08;复随机变量&#xff09;的方差和协方差矩阵该如何计算呢&#xff1f;本文给出了复信号的方差和协方差矩…

什么是大数据、有什么用以及学习内容

目录 1.什么是大数据&#xff1f; 2.大数据有什么用&#xff1f; 2.1商业与营销&#xff1a; 2.2医疗与健康&#xff1a; 2.3金融服务&#xff1a; 2.4政府与公共服务&#xff1a; 2.5交通与物流&#xff1a; 2.6教育与个性化学习&#xff1a; 3.学习大数据需要学习哪…

C++笔试强训12、13、14

文章目录 笔试强训12一、选择题1-5题6-10题 二、编程题题目一题目二 笔试强训13一、选择题1-5题6-10题 二、编程题题目一题目二 笔试强训14一、选择题1-5题6-10题 二、编程题题目一题目二 笔试强训12 一、选择题 1-5题 引用&#xff1a;是一个别名&#xff0c;与其被引用的实…