端侧大模型系列 | 端侧AI Agent任务拆解大师如何助力AI手机?(简短版)

news2024/11/27 2:44:49
  • 引言

  • 简介

  • 模型

  • 实验

  • 意义&前景:

  • 总结

引言

今人不见古时月,今月曾经照古人。

小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖沙茶面的小女孩。

设想一下,你的智能手机不再只是"聪明",而是真正的"智能"。它不仅能响应指令,还能预测需求、规划日程,并轻松完成复杂任务。这不是科幻小说,而是设备内置AI助手的新时代,即将到来。NexaAI提出的Octo-planner通过分离规划与执行过程,将先进的AI功能装进你的口袋,无需持续联网或依赖云端处理,助力打造AI手机。

那么,Octo-planner有何独特之处?它如何在小巧设备中实现如此强大的智能?这对个人计算、隐私保护和AI的未来意味着什么?本文将简要介绍Octo-planner的内部机制,揭示其独特架构设计,并展示实验效果。

更详细的解读,可以点这里端侧Agent系列|端侧AI Agent任务拆解大师如何助力AI手机?(详解版)。如果对端侧模型感兴趣可以订阅整个合集。更多大模型相关,如模型解读、模型微调、模型部署、推理加速等,可以留意本微信公众号《小窗幽记机器学习》

小窗幽记机器学习

记录机器学习过程中的点点滴滴和坑坑洼洼

公众号

简介

随着AI技术的发展,AI Agent应用越来越广泛,但大多数依赖大型语言模型,需要强大计算资源和网络连接,限制了其在边缘设备上的应用。为此,研究人员提出了Octo-planner,一个专为边缘设备优化的规划Agent框架:Octo-planner。

Octo-planner是一个高效的Planner-Action框架,将规划和执行分为两个组件:针对边缘设备优化的规划Agent和使用Octopus模型的执行Agent。它将任务分解为子步骤,由Octopus执行。

为了在资源受限设备上优化性能,采用模型微调而非上下文学习,减少计算成本和能耗,提高响应速度。使用GPT-4生成多样化的规划查询和响应,并进行数据验证。在精选数据集上微调Phi-3 Mini模型后,在领域内测试取得97%的成功率。

为应对多领域规划挑战,官方开发了多LoRA训练方法,合并不同功能子集上训练的LoRA权重,以灵活处理复杂多领域查询,同时保持计算效率。

模型

Octo-planner的核心创新在于将规划和执行分为两个独立的组件:

  1. 规划Agent(Octo-planner):负责将用户查询分解为一系列子步骤。

  2. 执行Agent(Octopus模型):负责执行具体的功能调用。

这种分离设计带来了几个重要优势:

  • 专业化:允许分别优化规划和执行模型,提高复杂任务的性能。

  • 可扩展性:可以独立扩展规划和执行能力,以适应不同复杂度的任务。

  • 可解释性:通过明确分离各个阶段,提高决策过程的透明度。

  • 适应性:可以更容易地将特定领域的知识或约束集成到任一阶段,而无需对整个系统进行更改。

数据集生成和训练过程包括以下步骤:

  1. 数据集收集:使用GPT-4根据可用函数生成多样化的查询和响应。

  2. 数据验证:使用同一语言模型评估查询-响应对的正确性,过滤掉不正确的输出。

  3. 模型微调:使用验证后的数据集对基础模型进行微调。

实验

研究人员还进行了一系列实验,以评估Octo-planner在不同配置下的性能:

  1. 全量微调 vs LoRA:

    • 全量微调达到了98.1%的最高准确率。

    • LoRA的性能取决于rank大小,最高的准确率为85.1%。

  2. 多LoRA训练和合并:

    • 单领域Android函数集LoRA达到85.1%的准确率。

    • 合并两个领域(Android和电商)的LoRA,准确率略有下降至82.2%。

    • 合并三个领域(增加视频流)的准确率为78.9%。

    • 合并四个领域(增加旅行)的准确率降至69.7%。

  3. 不同基础模型的全量微调:

    • Google Gemma 2b:85.6%

    • Google Gemma 7b:99.7%

    • Microsoft Phi-3 Mini:98.1%

  4. 不同训练数据集大小的影响:

    • 1000个数据点:98.1%

    • 500个数据点:92.5%

    • 250个数据点:85.3%

    • 100个数据点:78.1%

这些实验结果为在边缘设备上部署高效、准确的规划模型提供了重要的参考。

意义&前景

  1. 边缘AI赋能:使复杂的AI规划能力在资源受限的设备上运行,为智能手机、IoT设备等带来新的可能性。

  2. 隐私保护:本地处理减少了数据传输,强化用户隐私保护。

  3. 离线能力:不依赖网络连接,可在无网络环境下工作。

  4. 低延迟:本地处理显著降低了响应时间,提升用户体验。

  5. 成本效益:减少了云计算依赖,降低了运营成本。

  6. 多领域适应:通过多LoRA合并技术,可以灵活应对复杂的多领域查询。

总结

人工智能(AI)Agent在多个行业中引发变革,提升了自主决策能力和运营效率。然而,大型语言模型(LLMs)的高计算需求限制了其普及。为解决这一问题,推出了Octo-planner,这是一种专为边缘设备优化的计划Agent。它通过分离计划和执行,使用GPT-4生成和验证数据,将规划成功率提高到97%。多LoRA训练方法支持复杂多领域查询,实现高效设备内操作。Octo-planner为边缘AI Agent的发展开辟了新道路,可能彻底改变与智能设备的交互方式,并为各行业带来创新机会。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2187271.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

12.梯度下降法的具体解析——举足轻重的模型优化算法

引言 梯度下降法(Gradient Descent)是一种广泛应用于机器学习领域的基本优化算法,它通过迭代地调整模型参数,最小化损失函数以求得到模型最优解。 通过阅读本篇博客,你可以: 1.知晓梯度下降法的具体流程 2.掌握不同梯度下降法…

力扣 中等 129.求根节点到叶子结点数字之和

文章目录 题目介绍解法 题目介绍 解法 法一:有返回值、 class Solution {public int sumNumbers(TreeNode root) {return dfs(root, 0);}public int dfs(TreeNode root, int x) {if (root null) {return 0;}x x * 10 root.val;if (root.left root.right) { //…

LC刷题专题:dfs、哈希表合集

自己刷题缺少分类思想,总是这里刷一道那里刷一道,以后建立几个专辑,然后自己新刷的同类型的题目都会即使更新上。 文章目录 690. 员工的重要性 690. 员工的重要性 2024-10-03 题目描述: 我第一次写并没有考虑到dfs,…

基于Arduino的L298N电机驱动模块使用

一.简介: L298N作为电机驱动芯片,具有驱动能力强,发热量低,抗干扰能力强的特点,一个模块可同时驱动两个直流电机工作,能够控制电机进行正转、反转、PWM调速。 说明: 1)12V输入端口接入供电电压…

esp32开发环境搭建和烧录测试

文章目录 前言一、硬件环境1、esp32开发板。2、两个micro usb 数据线,一路用于供电,另一路用于烧录和调试3、喇叭, 淘宝上买的 4 欧姆 3 W扬声器 二、软件环境配置1、开发软件2、ESP-IDF简介下载 3、vscode安装配置1、安装vscode2、安装IDF插…

论文提纲怎么写?分享5款AI论文写作软件

在学术研究和写作过程中,撰写高质量的论文是一项挑战性的任务。幸运的是,随着人工智能技术的发展,AI论文写作工具逐渐成为帮助学者和学生提高写作效率的重要工具。这些工具不仅能够提高写作效率,还能帮助简化复杂的写作流程&#…

C++(string类的实现)

1. 迭代器、返回capacity、返回size、判空、c_str、重载[]和clear的实现 string类的迭代器的功能就类似于一个指针,所以我们可以直接使用一个指针来实现迭代器,但如下图可见迭代器有两个,一个是指向的内容可以被修改,另一个则是指…

【JNI】hello world

JNI,作为java和C/C的中间层,为在Java中调用C/C代码提供了便利。作为初学者,这里简单记录学习的过程。 本文所有的操作都在kali linux上进行,jdk环境以及gcc,g编译器需自行提前安装好 操作系统: jdk&#…

行为型模式-命令-迭代-观察者-策略

命令模式 是什么 将一个请求封装成为一个对象, 从而可以使用不同的请求对客户进行参数化,对请求排队或记录请求日志,以及可以撤销的操作 实例 请求封装成为对象 //用来声明执行操作的接口 public abstract class Command { protected Receiver receiver; public Comma…

【网络原理】Udp报文结构,保姆级详解,建议收藏

💐个人主页:初晴~ 📚相关专栏:计算机网络那些事 一、UDP报文格式 ​ ​ 可以看出UDP报文主要由报头和正文两部分构成,报头存储了此次报文的一些重要信息,而正文才是真正需要传输的内容。本篇文章就主要…

【Kubernetes】常见面试题汇总(五十二)

目录 116. K8S 集群服务暴露失败? 117.外网无法访问 K8S 集群提供的服务? 特别说明: 题目 1-68 属于【Kubernetes】的常规概念题,即 “ 汇总(一)~(二十二)” 。 题目 69-…

Windows 环境上安装 NASM 和 YASM 教程

NASM 和 YASM NASM NASM(Netwide Assembler)是一个开源的、可移植的汇编器,它支持多种平台和操作系统。它可以用来编写16位、32位以及64位的代码,并且支持多种输出格式,包括ELF、COFF、OMF、a.out、Mach-O等。NASM使用…

复习HTML(进阶)

前言 上一篇的最后我介绍了在表单中&#xff0c;上传文件需要使用到 method属性 和enctype属性。本篇博客主要是详细的介绍这些知识 <form action"http://localhost:8080/test" method"post" enctype"multipart/form-data"> method属性…

SQL Inject-基于报错的信息获取

常用的用来报错的函数 updatexml() : 函数是MYSQL对XML文档数据进行查询和修改的XPATH函数。 extractvalue(): 函数也是MYSQL对XML文档数据进行查询的XPATH函数。 floor(): MYSQL中用来取整的函数。 思路&#xff1a; 在MySQL中使用一些指定的函数来制造报错&am…

YOLOv8改进 - 注意力篇 - 引入SEAttention注意力机制

一、本文介绍 作为入门性篇章&#xff0c;这里介绍了SEAttention注意力在YOLOv8中的使用。包含SEAttention原理分析&#xff0c;SEAttention的代码、SEAttention的使用方法、以及添加以后的yaml文件及运行记录。 二、SEAttention原理分析 SEAttention官方论文地址&#xff1…

深度学习——线性神经网络(一、线性回归)

目录 一、线性回归1.1 线性回归的基本元素1.1.1 术语介绍1.1.2 线性模型1.1.3 损失函数1.1.4 解析解1.1.5 随机梯度下降1.1.6 模型预测 1.2 正态分布与平方损失 因为线性神经网络篇幅比较长&#xff0c;就拆成几篇博客分开发布。目录序号保持连贯性。 一、线性回归 回归&#x…

基于单片机智能百叶窗卷帘门自动门系统

** 文章目录 前言概要功能设计设计思路 软件设计效果图 程序文章目录 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师&#xff0c;一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对…

二叉树深度学习——将二叉搜索树转化为排序的双向链表

1.题目解析 题目来源&#xff1a;LCR 155.将二叉搜索树转化为排序的双向链表 测试用例 2.算法原理 首先题目要求原地进行修改并且要求左指针代表前驱指针&#xff0c;右指针代表后继指针&#xff0c;所以思路就是 1.使用前序遍历创建两个指针cur、prev代表当前节点与前一个节点…

STM32三种启动模式:【详细讲解】

STM32在上电后&#xff0c;从那里启动是由BOOT0和BOOT1引脚的电平决定的&#xff0c;如下表&#xff1a; BOOT模式选引脚启动模式BOOT0BOOT1X0主Flash启动01系统存储器启动11内置SRAM启动 BOOT 引脚的值在重置后 SYSCLK 的第四个上升沿时被锁定。在重置后,由用户决定是如何设…

硬件开发笔记(三十):TPS54331电源设计(三):设计好的原理图转设计PCB布板,12V输入电路布局设计

若该文为原创文章&#xff0c;转载请注明原文出处 本文章博客地址&#xff1a;https://hpzwl.blog.csdn.net/article/details/142694484 长沙红胖子Qt&#xff08;长沙创微智科&#xff09;博文大全&#xff1a;开发技术集合&#xff08;包含Qt实用技术、树莓派、三维、OpenCV…