【ai_agent】从零写一个agent框架(四)用rust制作一个python的虚拟运行环境。

news2024/9/29 17:25:39

前言

为了增加框架的扩展性和适用性,我们要能够在流程节点中运行python脚本。

这个时候需要考虑几个问题:

1 为什么是python?

思考:老实说我并不喜欢python,我更倾向于lua这种短小轻快的脚本。在我之前写的规则引擎rush里,就用的lua脚本写规则。并且我对比过多个脚本的性能,lua可以甩python几条街。

但是,python是大众的选择,被更多的人接受,没得选,只能是它。

这里有屌大的就要说了,为啥不用js,不用wasm,它们用的人也很多。不管是从应用的角度看,还是从平台的角度讲,长远来看这哥俩也是要支持的。

2 能在业务pod里面执行python吗?

肯定是不能,一般在服务端运行的脚本都要有个沙盒环境。

  • 一是为了避免不同本地环境造成的版本差异,包的差异等等。
  • 二是为了打造一个安全封闭的运行环境,避免和其他服务相互影响。

3 用类似cmd这种命令执行python脚本可以吗?

当然是不可以,因为这会失去对脚本的约束。

4 运行python文件还是运行python文本?

在表现形式上,文本能力必须要支持。绝大多数的agent编辑平台提供的都是python文本的编辑能力,运行能力,可能它们对于python脚本的定义仅用来实现一些简单功能。

但是我做的agent越多就越难受,因为一个稍微复杂的功能,我要在这个文档框里写大几千行,实难维护。

这些平台提供的编辑视图,都极为垃圾,我们很难在浏览器上做到vscode或者pycharm这种专业编辑器的舒适度

更重要的是一些复杂功能需要多个文件来编写,如果仅支持文本就自废武功了。

实现

思路如下:

用rust包装一个python的运行时,然后做成docker ,对外提供一个rpc的接口。

代码仓库传送门

python运行时实现

  • 我这里用的pyo3完成rust和python的绑定。
  • python的入口必须是一个函数,但函数可以指定
  • 支持指定syspath,这样就可以加载python文件。文件可以通过k8s的pv挂载,或者as3挂载。
  • 这里安全相关的模块我懒的做了,工程链路里是必须要做的。

代码如下:

pub  fn eval_function(&self, function_name: &str, args: Value) -> PyResult<Value> {
    wd_log::log_debug_ln!("eval_function -> {:?} args:{:?}", self, args);
    let  Self {
        src,
        module_name,
        file_name,
        sys_path,
    } = self;
    let file_name = file_name.clone().unwrap_or(format!("{}.py", module_name));
    Python::with_gil(move |py| {
        //设置系统path
 if  let  Some(path) = sys_path {
            let syspath: &PyList = py.import_bound("sys") ? .getattr("path") ? .extract() ? ;
            syspath.insert(0, &path) ? ;
        }
        //加载模型
 let module = match src {
            ScriptSrc::ScriptCode(script) => PyModule::from_code_bound(
                py,
                script.as_str(),
                file_name.as_str(),
                module_name.as_str(),
            ) ? ,
            ScriptSrc::ModuleName => PyModule::import_bound(py, module_name.as_str()) ? ,
        };
        //加载函数
 let function = module.getattr(function_name) ? ;
        //拼接输入
 let input_obj = Self::value_to_py_object(py, args) ? ;
        let input_class = FunctionInput { data: input_obj };
        //调起函数
 let output_obj = function.call((input_class,), None) ? .extract::<PyObject>() ? ;
        //输出转格式
 let value = Self::py_object_to_value(output_obj, py) ? ;
        Ok(value)
    })
}

入参的绑定

  • 入参绑定为python的class,如下代码,真正的入参是这个class里面的data
  • 包装class的目的是为py提供一些外部方法,可以操作rust里面的内容,或者获取一些不可变更参数,当然懒惰的我没实现任何方法。
#[pyclass]
pub  struct FunctionInput {
    #[pyo3(get, set)]
    data: PyObject,
}

对外接口

对外我们还是提供grpc接口,proto文件如下:

  • 这里我们指明入参类型是google/protobuf/struct,它最终会转化为python的dict传给py脚本。
  • grpc的实现我这里就不贴了,主要用的tonic框架。
  • tonic的client需要我们自己实现连接池,我用的wd_tools::pool:ObjPool
syntax = "proto3";

package proto;

import "google/api/annotations.proto";
import "google/protobuf/struct.proto";

service PythonRuntimeService{
    rpc CallFunction(CallFunctionRequest)returns (CallFunctionResponse){
        option (google.api.http) = {
            post: "/api/v1/function/{function_name}"
            body: "*"
        };
    };
}

enum  SrcType {
    SRC_TYPE_SCRIPT = 0;
    SRC_TYPE_MODULE = 1;
}
message CallFunctionRequest{
    SrcType src = 1;
    // if src == SRC_TYPE_SCRIPT, script_code must have a python code.
optional string script_code = 2;
    string module_name = 3;
    //default: file_name = module_name.py
optional string file_name = 4;
    optional string sys_path = 5;
    string function_name = 6;
    google.protobuf.Struct function_input = 7;

}
message CallFunctionResponse{
    // 0:success
int32 code = 1;
    string msg = 2;
    optional google.protobuf.Struct output = 3;
}

docker构建

因为我们用的pyo3,它依赖libpython和rust环境,所以我们需要对rust的官方镜像做亿点小小的改造。

  • 首先rust的官方镜像就很有问题,用它镜像打出来的包里面的依赖都不完整。比如用rust:1.78-alpine打包就一直提示缺着缺那。
  • rust的alpine的镜像使用musl编译,按理说我静态编译后,它应该更容易被用起来。万万没想到在相同版本的alpine镜像中竟然跑不起来。
  • pyo3在编译的时候,会内置一些py信息,即便的相同的版本,不同的运行系统也无法编译。也就是说我们很难跨平台编译。

当然还有一堆堆的坑,所幸我已经爬完了,并且把镜像放到了hub上。

  • 构建镜像:wdshihaoren/python_rt:build-1.75-240527 ,你也可以用它编译自己的任意rust项目。
  • 运行镜像:wdshihaoren/python_rt:16896997,非常的精简小巧,只有30M,如下图:

image.png

测试

首先启动测试用例,在python_rt目录下如下命令启动

  • 先装一下psutil库
cargo test tests::run_server -- --nocapture

先测试一下文件执行,py文件内容地址,用grpc请求结果如下:

请求:
{
  "src": 1,
  "module_name": "sys_info",
  "sys_path":"./custom_plugin",
  "function_name": "get_system_info",
  "function_input": {
    "fields": {
      "hello": {
        "kind": "world"
      }
    }
  }
}
响应:
{
  "code": 0,
  "msg": "success",
  "output": {
    "fields": {
      "cpu_count": {
        "numberValue": 12,
        "kind": "numberValue"
      },
      "cpu_percent": {
        "numberValue": 16.7,
        "kind": "numberValue"
      },
      "disk_free": {
        "numberValue": 141.9490623474121,
        "kind": "numberValue"
      },
      "disk_total": {
        "numberValue": 465.62699127197266,
        "kind": "numberValue"
      },
      "disk_used": {
        "numberValue": 23.568099975585938,
        "kind": "numberValue"
      },
      "memory_available": {
        "numberValue": 11853.76171875,
        "kind": "numberValue"
      },
      "memory_total": {
        "numberValue": 32768,
        "kind": "numberValue"
      },
      "os_release": {
        "stringValue": "21.3.0",
        "kind": "stringValue"
      },
      "os_type": {
        "stringValue": "Darwin",
        "kind": "stringValue"
      }
    }
  }
}

再测试一下参数输入:正确给出结果

输入:
{
  "src": 1,
  "module_name": "sys_info",
  "sys_path": "custom_plugin",
  "function_name": "generate_system_report",
  "function_input": {
    "fields": {
      "cpu_count": {
        "numberValue": 12,
        "kind": "numberValue"
      },
      ...//和上面的内容一样,粘下来就可以了
    }
  }
}
输出:
{
  "code": 0,
  "msg": ""\n系统报告:\n\n操作系统类型: Darwin\n操作系统版本: 21.3.0\nCPU逻辑核心数: 12.0\nCPU使用率: 23.5%\n内存总量: 32768.0 MB\n可用内存: 13596.53515625 MB\n磁盘总量: 465.62699127197266 GB\n磁盘已使用: 23.568099975585938 GB\n磁盘剩余: 159.18515014648438 GB\n    "",
  "output": {
    "fields": {}
  }
}

测试一下文本脚本能力,我们按照 【ai_agent】从零写一个agent框架(一)打造最强开放agent编辑框架,拳打dify,脚踩coze 中的实例依次启动服务。

然后如图创建三个节点,点击debug执行,可以看到python执行的结果。

image.png

尾语

做的事情很简单,但是坑很多,重点是很多事情需要权衡和思考。如果你有不一样的想法欢迎留言讨论。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1913692.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

简单仿写SpringIOC

gitee地址&#xff08;需要自取&#xff09;ioc_Imitation: 简单仿写IOC (gitee.com) 项目目录结构 Autowired Target(ElementType.FIELD) Retention(RetentionPolicy.RUNTIME) public interface Autowired { }Component Target(ElementType.TYPE) Retention(RetentionPoli…

云服务器centos7报错:Cannot find a valid baseurl for repo: base/7/x86_64

报错显示 我是使用FinalShell连接centos7&#xff1b; 如下图所示&#xff0c;尝试更新显示Cannot find a valid baseurl for repo: base/7/x86_64 网上找了很多教程最后没在点子上&#xff0c;最后我用gpt解决的&#xff0c;这里仅仅做一下记录&#xff08;因为我会忘记^_^&…

pnpm workspace使用教程【Monorepo项目】

目录 前言一、pnpm简介特点&#xff1a;对比 二、 创建项目添加文件 pnpm-workspace.yaml目录结构pnpm workspace: 协议修改配置文件执行 安装 三、命令解析执行包命令所有包操作命令 四、实例代码 前言 前面两篇&#xff0c;我们讲了 yarn workspace 和 lerna &#xff0c; …

枚举类 (enum)

目录 一、为什么要有枚举类&#xff1f; 二、枚举的简介 三、自定义枚举类 四、使用enum关键字 五、注意事项 一、为什么要有枚举类&#xff1f; 假如我们有这样的一个需求&#xff1a;设计季节类&#xff0c;并创建对象。 我们就需要以下操作&#xff0c;创建Season类&…

基于FPGA的数字信号处理(16)--定点数的舍入模式(7)6种舍入模式的总结

前言 在前面的6篇文章中&#xff0c;分别对6中舍入模式做了详细的介绍&#xff0c;本文在前文的基础上&#xff0c;再对这6种舍入模式做一个对比和总结。 6种舍入模式 在数据处理过程中&#xff0c;为了防止数据溢出而增加位宽是一种很常见的处理方式&#xff0c;但是随着算法链…

保姆级教程:Linux (Ubuntu) 部署流光卡片开源 API

流光卡片 API 开源地址 Github&#xff1a;https://github.com/ygh3279799773/streamer-card 流光卡片 API 开源地址 Gitee&#xff1a;https://gitee.com/y-gh/streamer-card 流光卡片在线使用地址&#xff1a;https://fireflycard.shushiai.com/ 等等&#xff0c;你说你不…

CVE-2024-6387Open SSH漏洞彻底解决举措(含踩坑内容)

一、漏洞名称 OpenSSH 远程代码执行漏洞(CVE-2024-6387) 二、漏洞概述 Open SSH是基于SSH协议的安全网络通信工具&#xff0c;广泛应用于远程服务器管理、加密文件传输、端口转发、远程控制等多个领域。近日被爆出存在一个远程代码执行漏洞&#xff0c;由于Open SSH服务器端…

记录|C#安装+HslCommunication安装

记录线索 前言一、C#安装1.社区版下载2.VS2022界面设置 二、HslCommunication安装1.前提2.安装3.相关文件【重点】 更新记录 前言 初心是为了下次到新的电脑上安装VS2022做C#上机位项目时能快速安装成功。 一、C#安装 1.社区版下载 Step1. 直接点击VS2022&#xff0c;跳转下…

项目实战--Spring Boot + GraphQL实现实时数据推送

背景 用户体验不断提升而3对实时数据的需求日益增长&#xff0c;传统的数据获取方式无法满足实时数据的即时性和个性化需求。 GraphQL作为新兴的API查询语言&#xff0c;提供更加灵活、高效的数据获取方案。结合Spring Boot作为后端框架&#xff0c;利用GraphQL实现实时数据推…

【基于深度学习方法的激光雷达点云配准系列之GeoTransformer】——粗配准

【GeoTransformer系列】——粗配准 1.coarse_matching1.1 概要1.2 功能1.3 超参1.4 input1.5 output2 coarse_target2.1 概要2.2 功能2.3 input2.4 output在模型部分有了初步了解之后, 接下来我们对后续的粗配准、精配准等部分依次进行解读. 本篇主要来看粗配准部分, 代码是在G…

叉车防撞系统:揭秘其多样化工作模式

叉车&#xff0c;作为物流仓储领域的重要工具&#xff0c;其安全性一直备受关注。随着科技的进步&#xff0c;叉车防撞系统应运而生&#xff0c;成为了叉车驾驶员的得力助手。那么&#xff0c;叉车防撞系统究竟是如何实现其安全防护的呢&#xff1f;让我们一同揭开&#xff0c;…

必看 | 最简单获取IP地址专用SSL证书的申请方法

申请IP地址专用的SSL证书并不像传统SSL证书那样普及&#xff0c;不是所有服务商都提供IP地址的SSL证书&#xff0c;因此需要仔细选择合适的服务商和流程进行操作申请&#xff0c;以此来实现IP地址访问的https。以下是最简单的IP地址专用SSL证书申请方法&#xff1a; 一、准备 …

YOLOv10改进 | 损失函数篇 | InnerIoU、InnerSIoU、InnerWIoU、FocusIoU等损失函数

一、本文介绍 本文给大家带来的是YOLOv10最新改进&#xff0c;为大家带来最近新提出的InnerIoU的内容同时用Inner的思想结合SIoU、WIoU、GIoU、DIoU、EIOU、CIoU等损失函数&#xff0c;形成 InnerIoU、InnerSIoU、InnerWIoU、等新版本损失函数&#xff0c;同时还结合了Focus和…

nprogress进度条插件

打开一个页面时&#xff0c;往往会伴随一些请求&#xff0c;并且会在页面上方出现进度条。它的原理时&#xff0c;在我们发起请求的时候开启进度条&#xff0c;在请求成功后关闭进度条&#xff0c;所以只需要在request.js中进行配置。 如下图所示&#xff0c;我们页面加载时发起…

一套完善的孕产妇保健信息化管理平台源码:管理了孕妇从怀孕开始到生产结束42天以内的一系列医院保健服务信息

数字化产科管理平台源码&#xff0c;智慧产科系统源码&#xff0c;采用java语言开发&#xff0c;前端框架为Vue&#xff0c;ElementUIMySQL数据库&#xff0c;前后端分离架构的数字化产科管理系统源码&#xff0c;自主版权&#xff0c;多个大型综合医院、妇幼保健院应用案例&am…

小米恢复联系人,跟着这2个步骤,让你的社交重回巅峰

当你突然发现小米手机里的联系人列表变得空空如也&#xff0c;是不是感觉就像失去了与外界沟通的“秘密武器”&#xff1f;别担心&#xff0c;这并不意味着你真的失去了他们。他们可能只是藏在了手机里的某个神秘角落&#xff0c;等待着你的召唤。接下来&#xff0c;小编将会介…

Redis实战—秒杀优化(Redis消息队列)

回顾 我们回顾一下前文下单的流程&#xff0c;当用户发起请求&#xff0c;此时会请求nginx&#xff0c;nginx会访问到tomcat&#xff0c;而tomcat中的程序&#xff0c;会进行串行操作&#xff0c;分成如下几个步骤。 1、查询优惠卷 2、判断秒杀库存是否足够 …

基于STM32的智能加湿器

1.简介 基于STM32的加湿器发展前景非常乐观&#xff0c;这主要得益于其在技术、市场需求、应用场景以及政策支持等多方面的优势。STM32微控制器具备强大的处理能力和丰富的外设接口&#xff0c;能够实现精确的湿度监测和智能化控制。基于STM32的加湿器可以根据环境湿度自动调节…

如何在 Windows 10 上恢复未保存的 Word 文档

您是否整晚都在处理一个重要的 word 文件&#xff0c;但忘记保存它了&#xff1f;本文适合您。在这里&#xff0c;我们将解释如何恢复未保存的 word 文档。除此之外&#xff0c;您还将学习如何恢复已删除的 word 文档。 从专业人士到高中生&#xff0c;每个人都了解丢失重要 W…

亚信安全新一代终端安全TrustOne2024年重磅升级

以极简新主义为核心&#xff0c;亚信安全新一代终端安全TrustOne自2023年发布以来&#xff0c;带动了数字化终端安全的革新。60%&#xff0c;安装部署及管理效率的提升&#xff1b;50%&#xff0c;安全管理资源的节省&#xff1b;100%&#xff0c;信创非信创场景的全覆盖。Trus…