香橙派 Kunpeng Pro 是一款面向开发者和教育市场的高性能单板计算机,其搭载了鲲鹏处理器,可提供 8TOPS INT8 计算能力,提供了 8GB 和 16GB 两种内存版本,开发板结合了鲲鹏全栈根技术,全面使能高校计算机系统教学和原生开发,同时支持 FPGA+ARM,从体系结构、数字逻辑设计、操作系统和编译,再到嵌入式开发,可以基于同一套体系结构和一套开发板实现贯穿打通。
本次测评将对开箱、硬件性能、软件兼容性以及实际使用体验进行详细评估。
一、开箱与第一印象
1. 包装内容
香橙派 Kunpeng Pro 包装整体感觉非常紧凑和精致。打开包装后,可以看到包含以下几项:
一个电源适配器:掂起来很有分量,显示其质量不错
一根双头 Type-C 数据线:用于连接和供电
一个装有香橙派 Kunpeng Pro 主板的盒子
2. 主板及组件
打开盒子后,可以看到香橙派 Kunpeng Pro 的主板。主板上的散热器和内存卡已经预先安装好了,这对不熟悉硬件安装的新手用户来说非常友好。
3. 主板背面
主板背面设计简洁,可以增加一个 SSD 固态硬盘,提供了进一步扩展存储的可能性。这对于需要大量数据存储的项目或应用程序来说是一个很大的优势。
4. 主板正面
主板正面设计也非常精致,各种接口和组件布局合理,做工细致。从初步观察来看,整个硬件设计体现了高质量的标准。
5. 初步印象
总体来说,香橙派 Kunpeng Pro 的开箱体验非常令人满意。包装精良,组件齐全且预装到位,初步给人的印象是这是一款高品质、高性能的开发板,适合多种应用场景。
二、硬件规格
香橙派 Kunpeng Pro 开发板是香橙派联合华为精心打造的高性能开发板,其搭载了鲲鹏处理器,可提供 8TOPS INT8 计算能力,提供了 8GB 和 16GB 两种内存版本。以下是香橙派 Kunpeng Pro 的硬件规格
组件 | 规格描述 |
---|---|
处理器 | 4 核 64 位 Arm 处理器 |
内存类型 | LPDDR4X |
内存容量 | 8GB 或 16GB |
存储 | 板载 32MB 的 SPI Flash, Micro SD 卡插槽, eMMC 插座:可外接 eMMC 模块, M.2 M-Key 接口:可接 2280 规格的 NVMe SSD 或 SATA SSD |
以太网 | 支持 10/100/1000Mbps, 板载 PHY 芯片:RTL8211F |
Wi-Fi+蓝牙 | 支持 2.4G 和 5G 双频 WIFI, BT4.2, 模组:欧智通 6221BUUC |
USB | 2 个 USB3.0 Host 接口, 1 个 Type-C 接口(只支持 USB3.0,不支持 USB2.0) |
摄像头 | 2 个 MIPI CSI 2 Lane 接口 |
显示 | 2 个 HDMI 接口, 1 个 MIPI DSI 2 Lane 接口 |
音频 | 1 个 3.5mm 耳机孔,支持音频输入输出,2 个 HDMI 音频输出 |
40 pin 扩展口 | 用于扩展 UART、I2C、SPI、PWM 和 GPIO 等接口 |
按键 | 1 个复位键,1 个关机键,1 个升级按键 |
拨码开关 | 2 个拨码开关:用于控制 SD 卡、eMMC 和 SSD 启动选项 |
电源 | 支持 Type-C 供电,20V PD-65W 适配器 |
LED 灯 | 1 个电源指示灯和 1 个软件可控指示灯 |
风扇接口 | 4pin,0.8mm 间距,用于接 12V 风扇,支持 PWM 控制 |
电池接口 | 2pin,2.54mm 间距,用于接 3 串电池,支持快充 |
调试串口 | Micro USB 接口的调试串口 |
支持的操作系统 | openEuler 22.03 |
三、首次开机
1. 简单易用的启动过程
首次开机非常简单,只需以下几步:
连接电源:使用包装内附带的电源适配器。
连接网线:确保设备能够通过 SSH 进行远程连接。
连接电源开机,并且接入网线后,就可以通过路由器后台看到香橙派 Kunpeng Pro 的内网 IP 地址,使用默认用户名openEuler
,密码openEuler
,就可以通过 SSH 连接到系统进行操作,非常方便。
2. 预装 openEuler 桌面系统
香橙派 Kunpeng Pro 预装了 openEuler 桌面系统,这使得开机后的用户体验更加友好。通过 HDMI 接口将设备连接到外部显示器,即可立即使用桌面环境。当然,有像我这样懒得扯网线插路由器看 IP 的,也可以直接拿 HDMI 连接显示器,启动后直接进入桌面系统,插上鼠标和键盘就可以手动连接 WiFi 了
3. 人性化设计的 HDMI 接口
香橙派 Kunpeng Pro 在设计上非常人性化,提供了两个标准的 HDMI 接口。这一点相比其他开发板(例如之前买过的一个树莓派 4B 8G,需要使用 mini HDMI 转接线)要方便许多,省去了额外购买转换线的麻烦。
4. 首次开机体验总结
总体而言,香橙派 Kunpeng Pro 的首次开机体验非常顺畅,系统启动速度也很快,得益于其预装的 openEuler 桌面系统和人性化的设计。无论是通过 SSH 远程连接还是直接连接显示器,都能快速上手并开始使用。
四、性能测试
测试前先使用下面命令更新一下软件到最新版本
sudo yum update
处理器性能测试:sysbench
使用以下命令安装 sysbench
sudo yum install sysbench -y
-
单线程测试
使用以下命令进行测试sysbench --test=cpu --cpu-max-prime=20000 run
可以看到检测结果显示内容每秒事件数(events per second): 812.15 总事件数(total number of events): 8126 总时间(total time): 10.0007秒 延迟(Latency): 最小值(min): 1.22毫秒 平均值(avg): 1.23毫秒 最大值(max): 1.59毫秒 95th 百分位(95th percentile): 1.23毫秒 总和(sum): 9998.18毫秒 线程公平性(Threads fairness): 事件(平均/标准差): 8126.0000/0.00 执行时间(平均/标准差): 9.9982/0.00
在测试中,每秒 812 个事件是一个不错的结果;平均延迟 1.23 毫秒,说明每个事件处理的时间很短,延迟很低,这对实时性要求较高的应用来说是个比较好的信号;最大延迟 1.59 毫秒和 95th 百分位延迟 1.23 毫秒都表明系统的性能较为稳定,没有出现较大的延迟波动;平均事件数和执行时间的标准差为 0,说明在单线程测试中,事件分配和执行时间非常均匀,未出现不公平的现象。总体来看,这个结果显示 CPU 在处理计算密集型任务时表现良好,具有较高的事件处理能力和较低的延迟。
-
多线程测试
使用以下命令进行测试sysbench cpu --cpu-max-prime=20000 --threads=4 run
可以看到检测结果显示内容每秒事件数(events per second): 2411.12 总事件数(total number of events): 24126 总时间(total time): 10.0015秒 延迟(Latency): 最小值(min): 1.22毫秒 平均值(avg): 1.66毫秒 最大值(max): 25.28毫秒 95th 百分位(95th percentile): 5.28毫秒 总和(sum): 39974.01毫秒 线程公平性(Threads fairness): 事件(平均/标准差): 6031.5000/1035.48 执行时间(平均/标准差): 9.9935/0.01
在测试中,每秒 2411.12 个事件表明在多线程环境下 CPU 的并行处理能力较强;平均延迟 1.66 毫秒,略高于单线程测试中的 1.23 毫秒,这表明多线程环境下,延迟有所增加,但仍在可接受范围内;最大延迟 25.28 毫秒和 95th 百分位延迟 5.28 毫秒显示出一些延迟峰值,这在多线程情况下是正常的;平均事件数 6031.5,标准差 1035.48,表明各线程之间的事件分配存在一定差异,但总体上比较均衡;执行时间的标准差非常小(0.01),表明线程执行时间非常接近。总体来看,CPU 能有效利用多线程并行处理能力,尽管多线程环境下延迟有所增加,但仍在合理范围内,且最大延迟和 95th 百分位延迟较低,表明系统在高并发情况下仍能保持较好的响应时间,各线程之间的执行时间差异很小,事件分配相对均衡,说明 CPU 能够较好地调度资源。
内存性能测试:sysbench
内存性能测试同样选择 sysbench,使用以下命令安装
sudo yum install sysbench -y
-
单线程测试
使用以下命令进行测试sysbench memory run
可以看到检测结果显示内容总操作数(Total operations): 29,287,007(每秒 2,927,315.30 次操作) 总传输量(Total transferred): 28,600.59 MiB(每秒 2,858.71 MiB) 总时间(Total time): 10.0001 秒 延迟(Latency): 最小值(min): 0.00 毫秒 平均值(avg): 0.00 毫秒 最大值(max): 0.35 毫秒 95th 百分位(95th percentile): 0.00 毫秒 总和(sum): 4,771.18 毫秒 线程公平性(Threads fairness): 事件(平均/标准差): 29,287,007.0000/0.00 执行时间(平均/标准差): 4.7712/0.00
在测试中,每秒传输量为 2,858.71 MiB,这表示内存写操作的吞吐量非常高,表明系统内存性能强大;总传输量为 28,600.59 MiB 在 10 秒内完成,表明系统在短时间内能处理大量的数据传输;每秒 2,927,315.30 次操作,总操作数 29,287,007,这些数值表明内存操作非常迅速和高效;平均延迟为 0.00 毫秒,最大延迟为 0.35 毫秒,95th 百分位延迟为 0.00 毫秒,所有这些都表明内存操作的延迟非常低,系统响应非常快;因为是单线程测试,所有操作都是由一个线程完成的,所以事件和执行时间的标准差为 0,表示线程执行非常均匀。总体来看这个内存的性能测试结果非常优秀,传输量表明系统具有非常高效的内存处理能力,延迟表名内存操作的延迟极低,系统在处理内存操作时反应非常快,此外尽管是单线程测试,操作分布和执行时间都非常均匀。
-
多线程测试
使用以下命令进行测试sysbench memory --memory-block-size=1K --memory-total-size=102400M --threads=4 run
可以看到检测结果显示内容总操作数(Total operations): 29,396,394(每秒 2,938,327.11 次操作) 总传输量(Total transferred): 28,707.42 MiB(每秒 2,869.46 MiB) 总时间(Total time): 10.0001 秒 延迟(Latency): 最小值(min): 0.00 毫秒 平均值(avg): 0.00 毫秒 最大值(max): 20.40 毫秒 95th 百分位(95th percentile): 0.00 毫秒 总和(sum): 32,020.82 毫秒 线程公平性(Threads fairness): 事件(平均/标准差): 7,349,098.5/449,942.11 执行时间(平均/标准差): 8.0052/0.05
在测试中,多线程环境下的内存写操作吞吐量非常高,表明系统在多线程条件下内存性能依然很强;每秒 2,938,327.11 次操作,总操作数 29,396,394,这些数值表明内存操作的执行速率很高,性能良好;平均延迟为 0.00 毫秒,最大延迟为 20.40 毫秒,95th 百分位延迟为 0.00 毫秒,表明在大多数情况下内存操作延迟非常低,但存在一些延迟峰值(最大延迟);延迟的最大值表明在某些情况下可能会有较高的延迟,但这些情况不常见(从 95th 百分位值来看);事件分配的平均值和标准差表明各线程之间的事件分配有一定差异(标准差较大);执行时间的平均值和标准差表明线程执行时间差异较小,尽管事件分配有一定差异,但整体执行时间较为均匀。总体来说,多线程测试展示了非常高的内存吞吐量,表明系统具有很强的并行处理能力,大部分操作的延迟非常低,尽管存在一些延迟峰值,但整体性能依然良好,线程执行时间较为均匀,但事件分配上存在一定差异,这可能是由多线程竞争资源或调度策略引起的。
五、性能测试结果总结
1. CPU 测试结果总结
多测了几次,并根据测试结果生成表格,方便对比数据及排除只测一次出现特殊情况的可能,整体来看差异并不是很大
测试类型 | 每秒事件数(Events per Second) | 总事件数(Total Number of Events) | 总时间(Total Time)(秒) | 平均延迟(Average Latency)(毫秒) | 最大延迟(Max Latency)(毫秒) | 95th 百分位延迟(95th Percentile Latency)(毫秒) | 线程公平性(Threads Fairness)(事件/标准差) | 执行时间(Execution Time)(秒/标准差) |
---|---|---|---|---|---|---|---|---|
单线程 | 812.15 | 8126 | 10.0007 | 1.23 | 1.59 | 1.23 | 8126.0000/0.00 | 9.9982/0.00 |
单线程 | 804.23 | 8047 | 10.0013 | 1.24 | 2.20 | 1.27 | 8047.0000/0.00 | 9.9988/0.00 |
单线程 | 805.45 | 8059 | 10.0010 | 1.24 | 2.20 | 1.27 | 8059.0000/0.00 | 9.9985/0.00 |
多线程 | 2411.12 | 24126 | 10.0015 | 1.66 | 25.28 | 5.28 | 6031.5000/1035.48 | 9.9935/0.01 |
多线程 | 2397.59 | 23990 | 10.0012 | 1.67 | 21.39 | 5.28 | 5997.5000/1149.94 | 9.9974/0.00 |
多线程 | 2408.91 | 24102 | 10.0006 | 1.66 | 22.37 | 5.28 | 6025.5000/745.14 | 9.9965/0.00 |
在单线程测试中,CPU 的每秒事件数约为 804.23 个,平均延迟约为 1.24 毫秒,最大延迟为 2.20 毫秒,这表明 CPU 在处理单个线程的计算密集型任务时表现良好,具有较高的事件处理能力和较低的延迟,单线程测试中 CPU 表现稳定,延迟较低且事件分配均匀,适合处理实时性要求较高的应用场景
在多线程测试中,使用 4 个线程进行测试,CPU 的每秒事件数分别为 2397.59 和 2408.91 个。平均延迟略高于单线程测试,分别为 1.67 毫秒和 1.66 毫秒,最大延迟也有所增加,从表格数据可以看出 CPU 的并行处理能力较强,可以有效利用多线程并行处理任务,但随着线程数增加,延迟也有所增加。然而,最大延迟和 95th 百分位延迟保持在相对较低的水平,系统在高并发情况下仍能保持较好的响应时间,执行时间方面,多线程测试中的事件分配相对均衡,线程执行时间差异较小,系统资源调度较为有效。
综合来看,处理器在单线程和多线程环境下均表现出良好的性能,适用于各种计算密集型任务的应用场景,能够有效地处理大量并发任务并保持较低的延迟和稳定的执行时间
2. 内存测试结果总结
多测了几次,并根据测试结果生成表格,方便对比数据及排除只测一次出现特殊情况的可能,整体来看差异并不是很大
测试类型 | 总操作数(Total Operations) | 总传输量(Total Transferred)(MiB) | 总时间(Total Time)(秒) | 平均延迟(Average Latency)(毫秒) | 最大延迟(Max Latency)(毫秒) | 95th 百分位延迟(95th Percentile Latency)(毫秒) | 线程公平性(Threads Fairness)(事件/标准差) | 执行时间(Execution Time)(秒/标准差) |
---|---|---|---|---|---|---|---|---|
单线程 | 29,287,007 | 28,600.59 | 10.0001 | 0.00 | 0.35 | 0.00 | 29,287,007.0000/0.00 | 4.7712/0.00 |
单线程 | 29,337,095 | 28,688.57 | 10.0001 | 0.00 | 0.08 | 0.00 | 29,337,095.0000/0.00 | 4.7808/0.00 |
单线程 | 29,335,885 | 28,648.33 | 10.0001 | 0.00 | 0.09 | 0.00 | 29,335,885.0000/0.00 | 4.7697/0.00 |
多线程 | 29,396,394 | 28,707.42 | 10.0001 | 0.00 | 20.40 | 0.00 | 7,349,098.5/449,942.11 | 8.0052/0.05 |
多线程 | 29,385,420 | 28,696.70 | 10.0001 | 0.00 | 20.05 | 0.00 | 7,346,355.0000/1272788.77 | 7.9079/0.04 |
多线程 | 29,608,350 | 28,914.40 | 10.0001 | 0.00 | 20.04 | 0.00 | 7,402,087.5000/449728.21 | 7.9144/0.04 |
在单线程测试中,三次测试的总操作数、总传输量和总时间基本持平,没有明显的变化,平均延迟和最大延迟在三次测试中也保持在极低水平,平均延迟为 0.00 毫秒,最大延迟最高也只有 0.09 毫秒,表明系统在单线程写入操作时响应速度非常快,延迟极低,线程公平性方面,三次测试的事件分配非常均衡,标准差都为 0.00,说明单线程写入操作的执行时间非常一致,系统资源分配较为均匀。
在多线程测试中,三次多线程测试中,总操作数、总传输量和总时间也基本保持一致,且均比单线程测试高出一些,测试中,平均延迟依然非常低,都在 0.00 毫秒左右,表明系统在并发写入操作时的响应速度依然非常快,但是,多线程测试中出现了一些最大延迟较高的情况,最高可达 20.40 毫秒,95th 百分位延迟也有较高值,说明在某些情况下可能会有较大的延迟峰值,但整体延迟仍然可接受,线程公平性方面,多线程测试的事件分配稍有差异,标准差略高,但仍然在合理范围内,表明多线程环境下系统资源分配相对均匀,各线程执行时间差异不大。
综合来看,在单线程和多线程写入操作下,系统表现出了非常高效的内存性能,响应速度极快,延迟极低,多线程测试中出现的延迟峰值虽然存在,但整体性能仍然稳定,适合处理大规模的并发写入任务,系统的内存性能表现良好,适合应对高并发、大规模数据写入的场景,能够保持稳定的响应速度和资源分配公平性。
3. 整体总结
香橙派 Kunpeng Pro 主板在性能表现上非常优秀,适合处理单线程和多线程任务,对存储和传输任务也有较好的处理能力。其丰富的硬件规格和扩展接口使其可以满足多种应用场景的需求,是一款性能优秀、功能丰富的主板。
六、更换操作系统记录
因为个人对 openEuler 不太熟悉,一般都使用 Ubuntu,所以还是烧录一个 Ubuntu 玩一玩,这里在官网找到了香橙派 Kunpeng Pro 官方资料,但是并没有提供 Ubuntu 的镜像
看了一些其他的开发板,看到 Orange Pi AIpro 的处理器参数与香橙派 Kunpeng Pro 一样,推测用的是同一种,所以下载了一下为 Orange Pi AIpro 提供的 Ubuntu 镜像进行烧录
把烧录好系统的内存卡插入香橙派 Kunpeng Pro,接上电源,为了方便连接网络和观察开机,我还是连接了一个显示器,开机正常启动,通过 OrangePi AI Pro 的用户手册可知登录密码为Mind@123
当然,后面香橙派 Kunpeng Pro 提供了镜像之后,最好还是更换为香橙派 Kunpeng Pro 提供的镜像,兼容性会更强一些
七、实际应用体验
作为一个全栈开发程序猿,可能会把开发板当做一个本地的小型服务器使用,在上面装 nginx 或者数据库等环境,搭建一些项目,平常会用到类似于宝塔面版或者 1Panel 面板搭建一些项目,这里我安装 1Panel 体验一下
1. 安装 1Panel
根据官方安装文档进行安装
安装过程中,我还安装了 web 代理工具和 MySQL 数据库,一切正常,没有问题
数据库连接也没有问题
2. 安装 supervisor 进程守护
Supervisor 是一个进程控制系统,可以帮助我们管理多个进程。使用以下命令安装:
sudo apt-get install supervisor
可以看到,服务运行正常
3. 安装 Fail2ban
Fail2ban 是一个用于防止暴力破解攻击的安全工具。使用以下命令安装 Fail2ban:
sudo apt-get install fail2ban
使用以下命令启动 fail2ban 服务
sudo systemctl start fail2ban
使用以下命令设置开机自启
sudo systemctl enable fail2ban
可以看到,服务运行正常
4. web 服务部署测试
这里拿自己开发的一个 web 服务进行部署测试,可以看到也正常访问
访问页面效果良好
5. 实际应用体验总结
通过以上的测试可以看出,香橙派 Kunpeng Pro 在实际应用中的表现非常出色。无论是作为一个本地服务器进行项目管理,还是运行各种服务和进程,它都能很好地完成任务。因此,这款开发板非常适合全栈开发人员作为本地开发和测试环境。
八、测评总结
优点
-
性能强劲,适合多种应用场景
CPU 性能:通过 sysbench 进行的单线程和多线程测试显示,香橙派 Kunpeng Pro 的 CPU 在处理计算密集型任务时表现良好。
内存性能:内存测试结果同样出色,内存操作的吞吐量非常高,系统响应速度极快,特别适合需要高内存带宽和低延迟的应用场景。 -
扩展性好,接口丰富
香橙派 Kunpeng Pro 配备了多种接口和扩展槽,提供了灵活的扩展性。这使得它能够满足不同的应用需求,从开发板到小型服务器都可以胜任。尤其是在更换为 Ubuntu 操作系统后,其兼容性和软件生态更为丰富,用户体验也得到了提升。 -
稳定的系统表现
在实际应用体验中,香橙派 Kunpeng Pro 表现稳定。无论是安装和运行 1Panel 进行项目管理,还是安装和配置 Supervisor 和 Fail2ban 这样的进程控制和安全工具,整个过程都非常顺利。搭建的 web 服务也能够正常运行,表明系统在长时间运行下依然能保持稳定和高效。
缺点
-
操作系统兼容性
初始使用的 openEuler 操作系统并不如 Ubuntu 那样广泛熟悉,且相关资料和支持相对较少。这对于习惯使用 Ubuntu 的开发者来说,可能需要一定的学习和适应时间。不过,更换为 Ubuntu 后,这个问题得到了很大程度的缓解。 -
线程公平性差异
在多线程测试中,尽管整体表现良好,但线程之间的事件分配存在一定差异,标准差较大。这可能导致在某些高并发应用场景下,资源分配不够均匀,影响整体性能。 -
社区资源相对较少,尤其是初始 openEuler 系统,在使用 openEuler 系统时也尝试进行实际应用体验,但是很多常用的开发工具不兼容,需要进一步完善
总结
香橙派 Kunpeng Pro 主板在性能测试中表现出色,尤其在 CPU 和内存性能方面,展现了强大的处理能力和低延迟特性。其丰富的硬件规格和扩展接口使其适用范围广泛,从单线程任务到高并发、多线程任务均能胜任。在更换为 Ubuntu 操作系统后,兼容性和用户体验进一步提升,使其成为一款非常适合开发者使用的开发板。
尽管在操作系统兼容性和线程公平性方面存在一些小问题,但这些并不影响其整体优异的性能表现和广泛的应用前景。对于需要高性能、稳定性和灵活扩展性的用户来说,香橙派 Kunpeng Pro 无疑是一个非常值得推荐的选择。