【大模型】相比现有智能体(Agent)系统,微软新推出的 Magnetic-One 值得一看吗?

news2024/11/25 11:03:18

微软最近发布的Magnetic-One智能体系统在开源社区引发了广泛关注,因其在性能、灵活性和扩展性方面表现出色,被誉为目前开源社区最强的智能体解决方案。本文将从评测结果、工作原理、与现有智能体系统的比较三个方面,全面解析Magnetic-One的独特优势,帮助你了解这一新一代智能体系统为何备受瞩目。

1. 系统评测结果

Magnetic-One系统凭借其卓越的任务分配、资源管理和决策能力,在开源智能体领域取得了显著成就,广泛被认可为性能最佳的开源智能体解决方案。评测结果显示,Magnetic-One在处理复杂任务、实现高效协同方面表现突出,适合需要多任务处理的智能体应用场景。然而,与闭源系统和人类执行者相比,Magnetic-One仍存在一定差距。例如,在面对动态变化的复杂环境时,闭源系统因其数据处理和策略优化的精细性而表现更优,而人类则在直觉判断和情境理解上拥有天然优势。

尽管如此,Magnetic-One在开源智能体解决方案中的表现依然出类拔萃。其高质量的评测结果为开发者和研究人员提供了强大、可靠的工具,使其能够在不依赖闭源系统的前提下,构建复杂智能体应用。

在这里插入图片描述
注:OS OSTA 指 Open Source State of the Art 即最新的开源成果,Non-OS 指的是非开源

2. Magnetic-One的工作原理

Magnetic-One的核心架构基于多智能体系统,其中主导的Orchestrator智能体负责总体任务规划,指导其他智能体并跟踪任务进度。Orchestrator在启动任务时首先制定整体计划,收集任务所需的事实信息和合理假设,记录在任务台账(Task Ledger)中。每一步执行过程中,Orchestrator都会在进度台账(Progress Ledger)中记录当前任务状态和进展,检查任务是否已完成。

如果任务尚未完成,Orchestrator会将子任务分配给系统中的其他智能体,如WebSurfer或Coder等。完成子任务后,Orchestrator更新进度台账,并继续下一步,直到任务全部完成。若Orchestrator在任务执行中发现长时间没有实质性进展,会重新评估任务台账,调整计划。这一双层循环设计包括外层循环用于维护和更新任务台账,内层循环用于实时跟踪和更新进度台账,使Orchestrator能够在任务管理过程中灵活响应变化和错误。
在这里插入图片描述

Magnetic-One包含以下几个智能体:

  1. Orchestrator:主导智能体,负责任务分解和整体规划,分配子任务给其他智能体,并在必要时采取纠正措施。

  2. WebSurfer:基于LLM的智能体,能够操控Chromium浏览器执行网页浏览操作,如导航、点击和输入。WebSurfer使用浏览器辅助树和标记提示来执行这些操作,从而能快速响应任务需求。

  3. FileSurfer:同样基于LLM的智能体,专为读取和操作本地文件而设计。FileSurfer能够导航文件夹结构、列出目录内容,方便对文件系统进行预览和操作。

  4. Coder:一个专门用于代码生成和信息分析的LLM智能体,可以编写代码、生成文档或基于其他智能体收集的信息创建新的输出。

  5. ComputerTerminal:提供对控制台的访问,使系统能够执行Coder生成的程序并安装新的编程库,进一步增强系统的操作能力。

这些智能体为Orchestrator提供了广泛的工具,使其可以应对各种开放式问题,并在动态的网页和文件系统环境中有效运作。

尽管默认配置下Magnetic-One使用GPT-4o作为各智能体的多模态语言模型,但其架构具有模型无关性,可以灵活选择不同的大型语言模型(LLM)和小型语言模型(SLM)。例如,Orchestrator可以使用推理能力较强的GPT-4o,在另一种配置中,OpenAI的o1-preview可以用于Orchestrator的外层循环和Coder智能体,而其他智能体继续使用GPT-4o。这种灵活的设计使Magnetic-One能够适应不同的性能需求和成本限制。

在这里插入图片描述

3. Magnetic-One的优势

Magnetic-One相比传统智能体系统在以下几个方面具备明显优势:

  1. 模块化设计与灵活性
    Magnetic-One的多智能体架构赋予系统高度的灵活性。每个智能体负责特定任务,相比于单体智能体系统更具适应性。这种模块化设计带来的主要优势包括:

    • 简化开发与复用:Magnetic-One的各智能体独立设计,便于构建和复用,极大简化了开发流程,类似于面向对象编程的优点。
    • 可扩展性:可以随时增减智能体,以扩展或调整Magnetic-One的功能,而无需改动其他智能体或系统架构。相比之下,传统单体架构系统结构较为固定,扩展性差。
  2. 增强的任务处理能力
    Magnetic-One的特化智能体(如WebSurfer、FileSurfer、Coder和ComputerTerminal)使得系统能够将复杂任务分解为子任务,再交给最合适的智能体处理。通过这种方式,系统在处理复杂任务时更高效,也使任务管理过程更加精细和清晰。

  3. 高效的任务和进度管理
    Orchestrator作为系统核心,通过双层循环机制进行高效的任务分配和跟踪:

    • 外层循环:负责总体任务规划和任务台账(Task Ledger)的管理,记录任务的总体信息、假设和策略。
    • 内层循环:实时跟踪进展,将任务状态记录在进度台账(Progress Ledger)中,并为合适的智能体分配子任务。
      双层循环设计不仅使Orchestrator能够灵活监控任务进度,还可以根据需要动态调整计划,并在遇到错误时快速恢复。
  4. 模型无关性与异构性
    Magnetic-One能够适应不同的大型语言模型(LLM)和小型语言模型(SLM),例如可以为Orchestrator选择推理能力强的GPT-4o。该设计不仅提升了各智能体的功能定制性,还允许在适当的场景中采用较低成本的模型,从而实现资源和成本的最优化。

  5. 注重负责任的AI实践与风险控制
    Magnetic-One的开发融入了负责AI的实践,例如红队测试等措施,用于识别和缓解智能体系统的潜在风险。开发团队还强调系统的日志监控、最小权限原则及最大限度的监管措施,以确保系统在执行过程中的安全性和可控性。


总结

微软的Magnetic-One智能体系统在开源智能体领域树立了新的标杆。其模块化、多智能体的设计赋予了系统高度的灵活性和任务处理能力,使其成为目前开源社区最强大的智能体解决方案。尽管与闭源系统及人类的直觉判断相比仍有差距,Magnetic-One的开放性、扩展性及负责任的AI实践,为开发者和研究人员提供了可靠的智能体构建平台。

未来,Magnetic-One在反馈学习和实时决策方面仍有巨大潜力,期待其持续进化,为智能体技术的发展奠定更加坚实的基础。

参考链接
  • https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
  • https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2237915.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++——左值和右值的本质区别

左值和右值好干嘛? 深入理解左值和右值可以帮助我们对代码进行优化 一、什么是左值和右值 左值:有某种存储支持的变量 右值:临时值(字面量、函数的结果) Ⅰ右值是字面量 int yy 22;22本身就是一个临时的&#xf…

Rust-AOP编程实战

文章本天成,妙手偶得之。粹然无疵瑕,岂复须人为?君看古彝器,巧拙两无施。汉最近先秦,固已殊淳漓。胡部何为者,豪竹杂哀丝。后夔不复作,千载谁与期? ——《文章》宋陆游 【哲理】文章本是不加人工,天然而成的,是技艺高超的人在偶然间所得到的。其实作者所说的“天成”…

深入了解支持向量机:机器学习中的经典算法

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

第01章 Linux概述及系统环境搭建

目标: ◆ 知道 Linux 是什么?有什么特点? ◆ 知道 Linux 内核及发行版的区别 ◆ 知道 Linux 的应用领域 ◆ 能够在虚拟机软件上新建虚拟机 ◆ 能够在虚拟机中挂载CentOS6.7光盘镜像 ◆ 能够根据需求安装CentOS6.7的操作系统 ◆ 能够对系统进行登录和关闭…

【题解】—— LeetCode一周小结45

🌟欢迎来到 我的博客 —— 探索技术的无限可能! 🌟博客的简介(文章目录) 【题解】—— 每日一道题目栏 上接:【题解】—— LeetCode一周小结44 4.平方数之和 题目链接:633. 平方数之和 给定一…

Python爬虫基础-正则表达式!

前言 正则表达式是对字符串的一种逻辑公式,用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则的字符串”,此字符串用来表示对字符串的一种“过滤”逻辑。正在在很多开发语言中都存在,而非python独有。对其知识点…

kdump 应该怎么安装 linux-crashdump kdump-tools

sudo apt install linux-crashdump sudo apt install crash sudo apt install kdump-tools 1. 两个工具的关系 linux-crashdump kdump-tools 在 Ubuntu 上安装 kdump 功能,这两个包都是相关的,但有不同的作用. linux-crashdump 是一个元包(…

STM32F405RGT6单片机原理图、PCB免费分享

大学时机创比赛时画的板子,比到一半因为疫情回家,无后续,,,已打板验证过,使用stm32f405rgt6做主控 下载文件资源如下 原理图文件 pcb文件 外壳模型文件 stm32f405例程 功能 以下功能全部验证通过 4路…

2024-11-01 - 统一身份认证 - OpenLdap - 中间件 - 流雨声

摘要 2024-11-01 周五 杭州 暴雨 调查问卷: https://www.wjx.cn/vm/exIBFDM.aspx# 2024年转瞬即逝,可是生活还在继续,这里有一项关于人工智能和项目管理对于效能关系的调研问卷,AI 对工作的作用和影响。问卷不采集个人信息,在此…

基于微信小程序的电商平台+LW示例参考

1.项目介绍 系统角色:管理员、普通用户功能模块:管理员(用户管理、商品分类、商品管理、订单管理、系统管理等),普通用户(个人中心、收藏、我的订单、查看商品等)技术选型:SpringBo…

python读取word的自动编号以及添加自动编号

目录 1、读取编号 读取示例 如何判断段落是否有自动编号呢? 如何区分不同的类型编号呢? 2、添加自动编号 有的时候需要提取word中带自动编号的信息。对于word中的文字很多第三方的库都可以搞定,但是,提取格式,可能…

ImportError: cannot import name ‘packaging‘ from ‘pkg_resources‘ 的参考解决方法

文章目录 写在前面一、问题描述二、解决方法参考链接 写在前面 自己的测试环境: Ubuntu20.04 ROS-Noetic 一、问题描述 自己在通过 pip install 安装module时 (使用的是 pip install mmcv)遇到如下问题: ImportError: cannot …

【论文笔记】Wings: Learning Multimodal LLMs without Text-only Forgetting

🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 基本信息 标题: Wings: Learning Multimod…

Tomasulo算法介绍

Tomasulo算法详细解释 #mermaid-svg-x5G4yi740f0ju3OB {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-x5G4yi740f0ju3OB .error-icon{fill:#552222;}#mermaid-svg-x5G4yi740f0ju3OB .error-text{fill:#552222;strok…

【C++练习】二进制到十进制的转换器

题目:二进制到十进制的转换器 描述 编写一个程序,将用户输入的8位二进制数转换成对应的十进制数并输出。如果用户输入的二进制数不是8位,则程序应提示用户输入无效,并终止运行。 要求 程序应首先提示用户输入一个8位二进制数。…

量子计算包kaiwu安装过程踩过的坑

目录 1 安装过程 2 官方代码测试 3 踩坑说明 首先,目前的kaiwu版本仅支持python3.8,所以必须要下载python3.8才能运行kaiwu 1 安装过程 step1: 在页面的SDK标签下,找到对应操作系统的kaiwu包。 step2: 下载python3.8到本地,可…

全文检索ElasticSearch到底是什么?

学习ElasticSearch之前,我们先来了解一下搜索 1 搜索是什么 ① 概念:用户输入想要的关键词,返回含有该关键词的所有信息。 ② 场景: ​ 1互联网搜索:谷歌、百度、各种新闻首页; ​ 2 站内搜索&#xff…

海鲜特写镜头视频素材去哪找 热门视频素材网站分享

作为美食自媒体创作者,海鲜特写镜头的视频素材无疑是提升内容吸引力和质量的重要利器。无论你想展示新鲜的海鲜原料、精美的烹饪过程,还是诱人的餐桌美食,精致的海鲜特写镜头都能极大地吸引观众的注意力。那么,问题来了&#xff1…

Unity 如何优雅的限定文本长度, 包含对特殊字符,汉字,数字的处理。实际的案例包括 用户昵称

常规限定文本长度 ( 通过 UntiyEngine.UI.Inputfiled 附带的长度限定 ) 痛点1 无法对中文,数字,英文进行识别,同样数量的汉字和同样数量的英文像素长度是不一样的,当我们限定固定长度后,在界面上的排版不够美观 痛点2…