eunomia-bpf项目重磅开源!eBPF 轻量级开发框架来了

news2024/11/26 18:34:17

近日,在 2022 云栖大会龙蜥峰会 eBPF & Linux 稳定性专场上,来自 eBPF 技术探索 SIG Maintainer 、浙江大学的郑昱笙分享了《eunomia-bpf:eBPF 轻量级开发框架》技术演讲,以下为本次演讲内容:

大家好!我是来自浙江大学的郑昱笙,今天为大家介绍下 eunomia-bpf 项目作为一个为了简化 eBPF 程序的开发、分发、运行而设计的轻量级 eBPF 开发框架的背景和目标;再通过一些简单的实例,展示一下 eunomia-bpf 是如何从云端一行命令下载运行 eBPF 程序、只编写内核态代码即可运行和导出事件,以及和 WebAssembly 的结合等功能,最后简要阐述一下 eunomia-bpf 的原理和设计实现的思路,探讨一下接下来的发展方向。

eunomia-bpf 项目龙蜥社区开源仓库:https://gitee.com/anolis/eunomia

概要

eunomia-bpf 起源于 2022 年全国大学生操作系统大赛,希望将 eBPF 程序作为服务运行,把 eBPF 程序打包为一个 JSON 对象,通过 HTTP 请求即可动态插拔运行任意一个可重定位的 eBPF 程序,并且可以适应不同内核版本和架构。比赛结束之后,在高校的几位老师和社区中的一些伙伴的帮助和指导下(在这里重点感谢西安邮电大学陈莉君教授及团队和龙蜥社区毛文安老师),逐步把这些想法变成了一个初具雏形的开源项目。

当前,eunomia-bpf 想要解决的问题或 eBPF 程序当前的开发和分发过程中存的痛点主要有以下两个:

第一对于新手而言,搭建和开发 eBPF 程序的门槛较高,不仅需要必须同时关注内核态和用户态两方面的交互和信息处理,还需要编写用户态加载代码。

第二在不同架构的不同内核版本上无法方便快捷地打包、分发、发布各种 eBPF 程序。eBPF 很多小工具由不同的语言开发,存在不同的接口,无法轻易集成到大型的可观测系统。当前没有很好的插件方案,很多时候必须重新编译整个可观测的框架,再重新部署上线,才能更新 eBPF 探针或数据处理模块。另外,如果引入第三方的用户态数据处理代码,代码崩溃会导致整个程序崩溃。

因此,针对上面两个问题,我们提出了三种解决思路:

1.针对初学者,只需要编写内核态代码即可自动获取内核态导出的数据,编译后即可进行加载和运行,降低了 eBPF 的学习成本,提高了开发效率。

2.基于 libbpf一次编译处处运行的特性,将用户态、内核态的编译和运行的完全分离,通过标准 JSON 或 WASM模块的方式进行分发,无需进行重新编译,应用启动占用资源少,时间短,甚至容器启动更短。

  • WebAssembly (缩写 WASM) 是一种基于堆栈虚拟机的二进制格式, WASM 是为了可移植的目标而设计。可作为 C/C+/RUST 等高级语言的编译目标,使客户端和服务器应用程序能够在 Web 上部署。到现在为止, WASM 已经发展成为一个轻量级、高性能、跨平台和多语种的软件沙盒环境,被运用于云原生软件组件,可以在非浏览器环境下运行。 WASM 的设计思路和 eBPF 也有不少相似之处。

3.只编写内核态代码的时候,使用 JSON 即可完成分发、加载、打包的过程,对于完整的、需要用户态和内核态进行交互的 eBPF 应用或工具,可以在 WASM 中编写复杂的用户态处理程序进行控制和处理,并且将编译好的 eBPF 字节码嵌入在 WASM 模块中一同分发,在目标机器上动态加载运行。

  • 和 WASM 生态项结合可以给 eBPF 程序带来许多特性,同时和 eBPF 程序原本的设计思路也不谋而合,比如可移植、隔离性、安全性,它也是一个跨语言、轻量级的运行环境等等。同时也可以借助 WASM 的相关工具完成 eBPF 程序的 OCI 镜像的存储和分发,最近 Docker 官方也推出了一个基于 WASM 的分发工具。

以上三部分就是 eunomia-bpf 的核心特性,接着和大家一起来看一些示例。

示例

eunomia-bpf 并不是一个完整的系统,而是类似于开发库和开发框架,可以很轻松地嵌入 Coolbpf 工具链里,也可以作为开发库或开发框架嵌入其他程序。

可以通过一行命令从网页端直接下载预编译好的 eBPF 程序运行。使用 WebAssembly 或 JSON 模块的方式进行分发,部署时无需重新编译,启动速度很快。eunomia-bpf 适用于通用的、任意类型的 eBPF 程序,不仅局限于 trace 方面的 kprobe、uprobe、fentry 等,也支持如 lsm、tc、xdp 等类型的 eBPF 应用,都只需要编写内核态代码即可完成。

上图中为放入 URL 里的形式,也可以换成 OCI 镜像或 Docker 镜像,可以存储在 Docker 仓库或 github package ,使用方式与 Docker 基本一致,只需简单地执行 pull、run 即可运行,也可以将编译好的程序包 push 下去直接使用。

而相比于传统的 Docker 镜像,它的启动速度更快,同时也保留了 eBPF 很重要的特性,可以轻松嵌入到其他程序作为子模块或插件使用。

通过 eunomia-bpf ,只需编写内核态代码即可正确运行,能够最大程度减少新手的上手障碍,省略了用户态的加载框架编写,能够自动导出内核态 perf event 或 ring buffer 事件。另外,它与和原生 libbpf 完全兼容,可以获取 libbpf tools 的内核态代码,无需修改任何代码,可直接运行。

可以额外添加 tracepoint ,也可以通过注释的形式添加其他内容。使用容器打包编译工具链,无需担心环境配置问题,一行命令生成项目模板、一行命令编译。

一般来说,一个完整的 eBPF 应用程序分为用户空间程序和内核程序两部分,用户空间程序负责加载 BPF 字节码至内核,或负责读取内核回传的统计信息或者事件详情,进行相关的数据处理和控制。

我们可以在 WASM 中编写用户态辅助程序,来完成安全、高效的用户态数据处理和控制逻辑,它同样具备 eBPF 的特性,例如安全性( WASM 和 eBPF 一样也是个沙盒环境,在用户态运行的时候即使 WASM 模块崩溃了,也不会造成宿主程序的异常退出)、可移植性、轻量级、模块化等等,也可以作为插件使用,添加新的数据处理逻辑时,也不需要更改原本的代码。(注意 WASM 是可选而不是必须的,对于一些简单的应用而言,编写内核态代码就足够了)

实际上,我们是用 C 语言编写代码,然后打包生成 WASM 模块,之后我们可以:

  • 借助 WebAssembly 的相关生态帮助分发、管理 eBPF 程序,例如 docker-wasm。
  • 可嵌入大型应用中作为 eBPF 可编程模块或插件使用。

这里演示的是一个简单的 WASM 模块,它可以获取当前系统的进程间的 signal 信号传递的事件,也可以接受一些命令行参数,并且对上报的信息进行处理。

目前来看,我们已经可以基本上不用进行代码修改,就可以直接把 BCC/libbpf-tools 里面的程序编译为 WASM 模块。对开发体验来说,也可以做到和使用 C 语言开发 libbpf 的 eBPF 程序完全相同,之后也可以引入其他的语言开发 SDK。

把 WASM 和 eBPF 结合起来主要的困难在于,WASM 的内存布局和 eBPF 程序并不一样,C 语言的结构体并不能直接映射,所以传递结构体必须要经过序列化操作。同时, WASM 对于访问系统资源,例如文件、网络等等,也有不少限制,很多标准库是缺失的,所以我们需要在 WASM 模块中进行一些特殊的处理和移植。

系统架构

架构底层依赖的是内核态和用户态的基础设施,比如 libbpf 库和 Kernel 中的 eBPF 虚拟机。在内核的基础设施这之上,我们会提供相关的编译工具链,和对应的运行时加载器,帮助生成 JSON 或打包成 WASM 的模块,工具链本身使用了比如 Clang/LLVM、bpftool 等工具。动态加载库可以独立使用,与 WASM 无关,也可以借助动态加载 JSON 配置信息即可热插拔、热更新 eBPF 程序的形式,通过 API 接口轻松实现 kernel function as a service(内核函数即服务)。

我们还实现了 WASM 抽象层,包含 API 规范,比如用于扩展 WASM 的虚拟机 WSAI 系统占用的访问形式或与 eBPF 交互的访问形式。还有基于 WASM 定制的 libbpf 库、移植的辅助态程序以及序列化库等,用于在 WASM 模块加载基于 libbpf 的 eBPF 程序。

运行时库可以轻松进行替换,比如替换成 WSI 的 WASM 运行时。除此之外,上层还在 LMP 项目中,实现了 eBPF hub 等包管理和分发设施,以及其他的命令行工具、可观测性工具等。

目前,eunomia-bpf 项目已在龙蜥社区开源,欢迎各位开发者体验,也欢迎大家提出建议和反馈,一起来做大做强。

相关链接:

eunomia-bpf 项目地址链接:

https://github.com/eunomia-bpf/eunomia-bpf

eBPF技术探索 SIG 地址:

https://openanolis.cn/sig/ebpfresearch

原文链接

本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/42531.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【新知实验室-TRTC开发】实时音视频之web端云监工系统(Vue3+Element plus+TS+Pinia)

在线上线下一体化、虚拟现实加速融合的趋势下,音视频已经演进成一种基本能力,深刻变革了社会的交互方式。未来,音视频作为全真互联时代的重要基石,将持续推动互联网和实体产业的数字化创新与升级。 今天我们将体验腾讯的实时音视…

vue3 antd table表格的增删改查(一)input输入框根据关键字搜索【后台管理系统纯前端filter过滤】

input输入框——关键字模糊搜索引言铺垫场景复现解决方案筛选的实现重置筛选信息优化处理(监听的实现)功能实现可能要用到的知识:vue3数据变化侦测&&信息筛选过滤.filter() .map() .forEach(). find()🔥vue3【watch检测/监…

[附源码]Python计算机毕业设计Django4S店汽车售后服务管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

【服务器数据恢复】IBM服务器RAID控制器出错的数据恢复案例

服务器数据恢复环境: 北京某公司IBM X系列某型号服务器; 服务器上共8块硬盘组建raid5磁盘阵列; 服务器上部署有oracle数据库。 服务器故障&分析: 服务器在运行过程中,raid5磁盘阵列中有2块硬盘报警,服务…

CRM(Mapper层)详细代码

Mapper详细代码: DicValueMapper: package com.bjpowernode.crm.settings.mapper;import com.bjpowernode.crm.settings.domain.DicValue;import java.util.List;public interface DicValueMapper {/*** This method was generated by MyBatis Generato…

制作覆盖手绘图的导游地图,非常简单,你也可以

目录 1 前言 2 手绘地图的准备 3 下载软件 4 切图软件基本设置 5 配准设置 6 从平台取得上传切片所需要的3个参数 7 程序切片 8 增加位置点 1 前言 上一篇介绍了制作“简版导游地图”的步骤,真的是特别简单,如果提前准备好了文字材料&#xff0c…

PHP转Go,框架选什么?

文章目录内功心法PHP转Go,优选哪个框架?为什么?为什么不火?GoFrame特点优势:劣势:框架选型谁适合用GoFrame谁不适合用GoFrameGoFrame框架设计思想开发流程从0到1核心步骤总结视频一起学习这是一期会引起广泛…

即时通讯赛道开打信创牌,WorkPlus为何独树一帜?

近期,信创火了。 随着近期国家相关政策文件的推出,未来三年,党政信创、行业信创以及央国企信创的建设,将迎来全面加速。业内人士认为:“大信创”时代或已来临! 信创是什么? 信创,…

加载用户数据至用户维度表

目录 1.创建转换 2.配置表输入 3.配置表输入2 4.创建新转换 5.配置映射输入规范 6.配置数据库查询 7.配置数据库查询2 8.配置数据库查询3 9.配置过滤记录 10配置JavaScript代码 11.配置字段选择 12.配置映射输出规范 13.配置映射(子转换) 1…

JS进阶第一篇:手写call apply bind

文章目录手写call apply bind深入理解 call 方法手写call手写apply手写bind手写call apply bind 深入理解 call 方法 call 理解了,apply和bind就都迎刃而解了,他们都是大同小异。在此对call和apply不做过多的定义性解释,先来看下调用了call…

opencv阈值图像Threshold方法

图像阈值 固定阈值,自适应阈值,Otsu 二值化等 全局阈值和局部阈值 一、图像二值化 定义:图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。 灰度值0&…

热门Java开发工具IDEA入门指南——导出项目到Eclipse

IntelliJ IDEA,是java编程语言开发的集成环境。IntelliJ在业界被公认为最好的java开发工具,尤其在智能代码助手、代码自动提示、重构、JavaEE支持、各类版本工具(git、svn等)、JUnit、CVS整合、代码分析、 创新的GUI设计等方面的功能是非常强大的。 上文…

打工人,这里有一份述职技巧,请查收

大家好,马上到年底了,有多少小伙伴正在期待着述职邮件,毕竟收到述职邮件,也就意味着有机会升职加薪。有没有跟糖糖一样,没收到邮件的? 工作要善于总结,也要善于表达,如何在限时内将…

跨平台应用开发进阶(四十)自定义插件及引用

文章目录一、前言二、插件制作三、离线插件集成应用示例四、拓展阅读一、前言 正如将可复用功能封装为自定义组件以供他人使用一样,在uni-app开发框架中提供了另一种形式的自定义插件,并可将该插件提交至uni-app插件市场。 二、插件制作 制作插件前&a…

前端 单元测试介绍 - 以及在项目中使用 (史上最全)

前言 我们前端开发过程中,编写测试代码,有以下这些好处: 更快的发现bug,让绝大多数bug在开发阶段发现解决,提高产品质量 比起写注释,单元测试可能是更好的选择,通过运行测试代码,观…

ARM 异常处理方式简单介绍

一、什么是异常 正常工作之外的流程都叫异常; 也就是说,除了用户模式和系统模式外,其他情况都是异常,见下图: 异常会打断正在执行的工作,并且一般我们希望异常处理完成后继续回来执行原来的工作&#xff…

3-azido-1-Propanamine,88192-19-2,3-叠氮基丙胺 性质特点有哪些?

●中文名:3-叠氮基丙胺,3-叠氮基-丙胺 ●英文名:3-azido-1-Propanamine ●外观以及性质: 西安凯新生物科技有限公司供应的:​3-azido-1-Propanamine为淡黄色或无色油状,含有叠氮基团,叠氮基可以…

Node.js 入门教程 23 使用 npm 的语义版本控制 24 卸载 npm 软件包 25 npm 全局或本地的软件包

Node.js 入门教程 Node.js官方入门教程 Node.js中文网 本文仅用于学习记录,不存在任何商业用途,如侵删 文章目录Node.js 入门教程23 使用 npm 的语义版本控制24 卸载 npm 软件包25 npm 全局或本地的软件包23 使用 npm 的语义版本控制 如果 Node.js 软件…

第147篇 笔记-预言机(Oracle)

定义:区块链预言机是将区块链连接到外部系统的实体,从而使智能合约能够基于现实世界的输入和输出执行。 预言机为分散的 Web3 生态系统提供了一种访问现有数据源、遗留系统和高级计算的方式。去中心化预言机网络(DON)支持创建混合…

[附源码]计算机毕业设计springboot“小世界”私人空间

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…