智谱开源新一代GLM模型,全面布局AI智能体生态

news2025/4/21 14:51:54

2024年4月15日,智谱在中关村论坛上正式发布了全球首个集深度研究与实际操作能力于一体的AI智能体——AutoGLM沉思。这一革命性技术的发布标志着智谱在AGI(通用人工智能)领域的又一次重要突破。智谱的最新模型不仅推动了AI智能体技术的升级,还开创了AI Agent的全新应用范式——边想边干

图片

AutoGLM沉思:AI Agent的新篇章

随着AutoGLM沉思的发布,智谱带来了全球首个能够同时进行深度研究实际操作的智能体。这一进步使得AI不再仅仅是一个“思考者”,而是一个可以实际执行任务的“行动者”。这一核心能力的实现,依赖于智谱自主研发的全栈大模型技术,并且在此次发布中,智谱还将核心技术链路开源,进一步推动行业生态的快速发展。

深度思考与自主行动的完美结合

AutoGLM沉思的发布,意味着AI智能体的核心能力已经从传统的推理阶段向实际执行阶段拓展。该智能体具备三大关键特性:

  1. 深度思考:能够模拟人类在面对复杂问题时的推理与决策过程。

  2. 感知世界:能够像人类一样获取并理解环境信息。

  3. 工具使用:能够主动调用和操作工具,完成复杂任务。

与OpenAI的Deep Research不同,AutoGLM沉思不仅能深入研究、提供分析,还能主动执行任务,推动AI Agent从单纯的思考者进化为能够交付结果的智能执行者。这一突破为未来的AGI发展奠定了坚实的基础。

图片

智谱GLM系列模型技术演进:开源再升级

智谱在此次发布的AutoGLM沉思背后,依托的是其自主研发的全栈大模型技术。这些技术不仅支撑了深度思考和实际操作的能力,也标志着智谱在大模型研发中的深厚积淀。

Image

1. 新版基座模型:GLM-4-Air-0414

作为基础模型,GLM-4-Air-0414 拥有320亿参数,利用大量的代码类和推理类数据训练,并在对齐阶段进行了优化。该模型特别适合于需要多轮复杂交互的智能体任务,能够快速高效地完成任务。它在工具调用、联网搜索和代码执行等任务中的表现尤为突出,成为AI智能体应用的坚实基石。

2. 新版推理模型:GLM-Z1-Air

GLM-4-Air-0414的基础上,智谱推出了推理优化模型GLM-Z1-Air。该模型在推理能力上与DeepSeek-R1(671B)相媲美,凭借其32B的参数,在AIME 24/25、LiveCodeBench、GPQA等多个基准测试中展现了强大的数理推理能力,支持解决更广泛的复杂任务。同时,GLM-Z1-Air的推理速度提升了8倍,并且具备更高的性价比,可以在消费级显卡上顺畅运行。

3. 沉思模型:GLM-Z1-Rumination

GLM-Z1-Rumination是智谱推出的全新沉思模型,在深度推理的基础上,结合了实时联网搜索、动态工具调用和自我验证的能力。这个模型突破了传统AI仅依赖内部知识推理的局限,能够主动获取外部信息进行实时修正,提升了推理的准确性和可靠性。它是AI从高智商向高智商与高自主并重阶段的飞跃,具备了极强的自主研究能力。

4. AutoGLM:全球首个设备操控智能体

AutoGLM系列是智谱在AI智能体领域的又一次创新突破,具有操作设备和执行复杂任务的能力。智谱自研的GLM-PC(CogAgent)在多个权威评测榜单上取得了SOTA成绩,超越了包括GPT-4o等更大规模的同类模型,展现了领先的AI执行能力。

卓越性能:推理速度与应用表现的双重突破

智谱的GLM系列模型,不仅在推理能力和实际应用的广度上取得了巨大的进展,其卓越的性能还体现在多个方面,尤其是在推理速度硬件兼容性上。

  1. 极速推理:
    GLM-Z1-Air推理速度可达200 Tokens/秒,是行业中推理速度最快的模型之一。这一速度相当于人类语速的50倍,为高并发、低延迟的应用场景提供了无与伦比的优势。与DeepSeek-R1(671B)相比,GLM-Z1-Air的推理速度提升了8倍,并且在性能的提升上,GLM-Z1-Air的计算成本也降低到了1/30,这为企业和开发者提供了更高性价比的选择。

    Image

    Image

  2. 硬件兼容性:
    为了降低硬件门槛,GLM-Z1-Air支持在消费级显卡上流畅运行,解决了传统大模型对计算资源的高要求问题。这意味着,开发者和企业能够更加灵活地部署AI模型,并且节省硬件成本。

  3. 性能表现:
    在性能表现上,可以与DeepSeek-R1(671B,激活37B)媲美。我们在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中对 GLM-Z1-Air 进行了评估,评估结果显示 GLM-Z1-Air 展现了较为强大的数理推理能力,为更多复杂任务的解决提供了支持。

    Image

下载链接

OpenCSG社区:https://opencsg.com/models/THUDM/GLM-Z1-9B-0414

HF社区:https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2339494.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分治-快排-75.颜色分类-力扣(LeetCode)

一、题目解析 给定一个数组将其元素按照0,1,,2三段式排序,并且在原地进行排序。 二、算法原理 解法:三指针 用cur遍历数组,left记录0的最左侧,right记录2的最右侧。 left初始值为-1,right的初…

铅酸电池充电器方案EG1253+EG4321

参考: 基于EG1253EG4321铅酸电池(48V20AH)三段式充电器 屹晶微高性价比的电瓶车充电器方案——EG1253 电瓶电压 48V电瓶锂电池,其充满约为55V~56V,因此充电器输出电压为55V~56V; 若是48V铅酸电池,标称电压为48V&…

vue 中formatter

:formatter 是前端表格组件(如 Element UI、Vxe-Table 等)中用于 ​​自定义单元格内容显示格式​​ 的属性。它的核心作用是:将后端返回的原始数据(如编码、状态值等)转换为更友好、更易读的文本。 这段代码 :forma…

协程?协程与线程的区别?Java是否支持协程?

一、前言 协程(Coroutine) 是一种轻量级的并发编程模型,允许在单线程内通过协作式多任务调度实现并发。由用户代码显式控制(用户态调度而非操作系统内核调度),避免了线程上下文切换的开销,适合…

Muduo网络库实现 [十六] - HttpServer模块

目录 设计思路 类的设计 模块的实现 公有接口 私有接口 疑问点 设计思路 本模块就是设计一个HttpServer模块,提供便携的搭建http协议的服务器的方法。那么这个模块需要如何设计呢? 这还需要从Http请求说起。 首先从http请求的请求行开始分析&…

关于进程状态

目录 进程的各种状态 运行状态 阻塞状态 挂起状态 linux中的进程状态、 进程状态查看 S状态(浅睡眠) t 状态(追踪状态) T状态(暂停状态) ​编辑 kill命令手册 D状态(深度睡眠&#…

SQL注入 01

0x01 用户、脚本、数据库之间的关系 首先客户端发出了ID36的请求,脚本引擎收到后将ID36的请求先代入脚本的sql查询语句Select * from A where id 36 , 然后将此代入到数据库中进行查询,查到后将返回查询到的所有记录给脚本引擎,接…

学习笔记:黑马程序员JavaWeb开发教程(2025.3.24)

11.2 案例-文件上传-简介 火狐浏览器可以看到文件上传传递的底层数据,而chrome对这一块数据进行了包装 在输出日志代码处打了一个断点,看服务端接收到的数据,在上传文件的保存地址中,可以看到,有三个临时文件&…

计算机视觉cv2入门之视频处理

在我们进行计算机视觉任务时,经常会对视频中的图像进行操作,这里我来给大家分享一下,cv2对视频文件的操作方法。这里我们主要介绍cv2.VideoCapture函数的基本使用方法。 cv2.VideoCapture函数 当我们在使用cv2.VideoCapture函数时&#xff…

【Linux】Rhcsa复习5

一、Linux文件系统权限 1、文件的一般权限 文件权限针对三类对象进行定义: owner 属主,缩写u group 属组, 缩写g other 其他,缩写o 每个文件针对每类访问者定义了三种主要权限: r:read 读 w&…

FFmpeg:M3U8的AES加密

1、加密用的key,命令: openssl rand 16>enc.key 2、目的是生成一个enc.key文件 生成iv openssl rand -hex 16 生成后记录下来这个字符串 3、新建一个enc.keyinfo文件,内容有如下三行: key URIenc.key的路径,…

VMware虚拟机走主机代理上网

🌐 VMware虚拟机走主机代理上网🔑 你是否也遇到过这样的困境?💡 在虚拟机中测试某个项目,却因为网络限制而寸步难行。今天,就让我们一起探索如何让VMware虚拟机轻松调用本机的代理上网工具,开启…

Cursor入门教程-JetBrains过度向

Cursor使用笔记 **前置:**之前博主使用的是JetBrains的IDE,VSCode使用比较少,所以会尽量朝着JetBrains的使用习惯及样式去调整。 一、设置语言为中文 如果刚上手Cursor,那么肯定对Cursor中的众多选项配置项不熟悉,这…

Mac OS系统下kernel_task占用大量CPU资源导致系统卡顿

CPU负载突然飙升,如截图: 根本原因,大家从各种博主上已知晓,现在提供自己的解决办法,亲测有效 一、设置开机自动禁用温度管理守护进程 1.创建脚本文件 mkdir -p ~/Scripts touch ~/Scripts/disable_thermald.sh …

宝塔面板部署 Dify-latest 最新版本

一、本地部署Windows 版本宝塔面板 宝塔面板是一款简单容易上手使用的服务器管理软件,它可以帮助用户方便地管理服务器以及部署网站等。 (1)在宝塔面板官网的下载界面,选择 windows 版本下载。点此进入下载 (2&#x…

《TCP/IP网络编程》学习笔记 | Chapter 24:制作 HTTP 服务器端

《TCP/IP网络编程》学习笔记 | Chapter 24:制作 HTTP 服务器端 《TCP/IP网络编程》学习笔记 | Chapter 24:制作 HTTP 服务器端HTTP 概要理解 Web 服务器端无状态的 Stateless 协议请求消息(Request Message)的结构响应消息&#x…

Origin将双Y轴柱状图升级为双向分组柱状图

当变量同时存在两个数值时的可视化时,往往会想到用双Y轴柱状图来表达我们的数据。 双Y轴柱状图是一种在同一图表中使用左右两个Y轴的可视化形式,常用于展示两组量纲不同或数值范围差异较大的数据。 双向分组柱状图是一种结合了双向柱状图和分组柱状图的…

测试基础笔记第六天

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、操作系统1.什么是操作系统2.操作系统的常见分类 二、linux系统1.linux发行版本2.文件和路径3.远程连接操作常见的远程连接工具远程连接基本步骤 三、linux命令操…

Edge Impulse 训练openMV分类模型(字母+数字)

前言 使用openMV Cam H7 Plus 固件4.5.9尝试多种方式均失败(模板匹配、ORB特征识别),还毁了一个sd卡,还是老老实实用Edge Impulse 训练吧 准备字母数字图片,使用Python生成,文件名要存成“A.jpg”这样&…

Linux 动、静态库的实现

前言:当我们写了一段代码实现了一个方法,如果我们不想把方法的实现过程暴露给别人看,可以把代码打包成一个库,其中形成后缀为.a的是静态库,后缀为.so的为动态库;当别人想使用你的方法时,把打包好…