书生·浦语全链路开源开放体系 第二期

news2024/11/25 20:43:26

文章目录

  • 大模型背景
  • 大模型开发流程
  • InternLM 2.0
    • SFT与RLHF
    • InternLM2主要亮点
  • 书生·浦语全链路开源开放体系
    • 数据-书生·万卷
    • InternLM-Train
    • 微调 XTuner
    • 评测工具 OpenCompass
    • 部署 LMDeploy
    • 智能体 Lagent
    • 智能体工具箱 AgentLego

大模型背景

专用模型:针对特定的任务,一个模型只能解决一个问题
通用大模型:一个模型可以应对多种不同的任务、多种模态
大模型成为发展通用人工智能的重要途径
在这里插入图片描述

大模型开发流程

模型到应用的开发流程
在这里插入图片描述

InternLM 2.0

InternLM 2.0包含InternLM2-Base、InternLM2和 InternLM2-Chat

  • InternLM2-Base:高质量和具有很强可塑性的模型基座,是模型进行深度领域适配的高质量起点
  • InternLM2:在Base基础上,在多个能力方向进行了强化 ,在评测中成绩优异,同时保持很好的通用语言能力
  • InternLM2-Chat:在Base基础上,通过SFT和RLHF,面向对话交互进行了优化,具有很好的指令遵循、共情聊天和调用工具等的能力
    在这里插入图片描述

SFT与RLHF

SFT(Structured Fine-Tuning)是一种模型优化技术,它通过在预训练的语言模型上进行有针对性的微调,以适应特定任务或领域。SFT可以提高性能的原因有几个:

  • 领域自适应:预训练的语言模型通常在大规模通用语料库上进行训练,而SFT可以通过在特定领域的数据上微调模型,使其更好地适应该领域的特定模式、术语和上下文。这种领域自适应可以提高模型在特定任务或领域中的性能。

  • 数据增强:SFT通常会使用特定任务或领域的数据来微调模型,这种数据增强可以丰富模型的训练数据,提供更多的样本和多样性,有助于改善模型的泛化能力和性能。

  • 参数调整:SFT允许对模型进行参数微调,以优化模型在特定任务上的表现。通过微调模型的参数,可以更好地适应任务的要求,提高性能。

RLHF(Reward Learning from Human Feedback)是一种使用人类反馈进行强化学习的技术。尽管RLHF可以在某些情况下提供性能改进,但它也可能对性能产生负面影响的原因包括:

  • 人类反馈的限制:RLHF依赖于人类提供的反馈信号来指导模型的学习。然而,人类反馈可能存在主观性、不一致性和有限性的问题。人类的主观判断和个体差异可能会导致训练出的模型在特定任务上的性能不稳定或低效。
  • 人类反馈的代价:收集和利用人类反馈可能需要大量的时间、人力和资源。人类标注大规模数据集或提供反馈的过程可能会成为瓶颈,限制了RLHF的应用范围和效率。
  • 环境差异:人类反馈通常是在特定环境下给出的,而这个环境可能与模型在实际应用中所面临的环境存在差异。这种环境差异可能导致模型在实际应用中的性能与在训练时根据人类反馈所表现的性能不一致。

InternLM2主要亮点

InternLM2通过新一代数据清洗过滤技术,性能上达到了多个亮点。

  • 超长上下文理解:模型在20万token上下文中,几乎完美的实现“大海捞针”
  • 综合性能全面提升:推理、数学、代码提升显著
  • 优秀的对话和创作体验:精准指令跟随,丰富的结构化创作,在AlpacaEval2超越GPT-3.5和Gemini Pro
  • 工具调用能力整体升级:可靠支持工具多轮调用,复杂智能体搭建
  • 突出的数理能力和实用的数据分析功能:强大的内生计算能力,加入代码解释后,在GSM8K和MATH达到和GPT-4相仿水平
    在这里插入图片描述
    在这里插入图片描述

书生·浦语全链路开源开放体系

书生·浦语大模型开源历程
在这里插入图片描述

书生从训练到应用的全过程开源,包括数据准备,预训练架构InternLM-Train,微调框架XTuner,部署框架LMDeploy,评测工具OpenCompass,在应用方面智能体Lagent和智能体工具箱AgentLego。
在这里插入图片描述

数据-书生·万卷

包括超1TB的50亿个文档的文本数据、超140G的2200万个图像-文本数据集和超900G的1000多个视频数据,进行了多模态融合、精细化处理和价值观对齐等处理

请添加图片描述

InternLM-Train

  • 高可扩展,支持扩展到千卡训练
  • 极致性能优化,Hybrid Zero加速技术
  • 兼容主流,无缝接入HuggingFace等技术生态,支持各类量化技术
  • 开箱即用,支持多种规格语言模型,修改配置即可训练

请添加图片描述

微调 XTuner

大语言模型的下游应用中,增量训练和有监督微调是经常用到的两种方式

  • 增量训练,让基座模型学习到新知识
  • 有监督微调,让模型学会理解和遵循各种指令,或注入少量的领域知识

XTuner框架

  • 支持多种微调算法,多种微调策略与算法,覆盖各类SFT场景
  • 适配多种开源生态,支持HuggingFace、ModelScope模型或数据集
  • 自动优化加速,无需关注复杂的显卡优化
  • 适配多种硬件,支持NVIDIA 20系列以上的所有显卡

评测工具 OpenCompass

国内外评测工具
在这里插入图片描述

OpenCompass评测工具发展历程
在这里插入图片描述

OpenCompass评测工具,是全球领先的大模型开源评测体系,包括6大维度

  • 学科,包括初中考试、高考、大学考试、语言能力考试、职业资格考试
  • 语言,字词释义、成语习语、语义相似、指代消解、翻译
  • 知识,知识问答、多语种知识问答
  • 理解,阅读理解、内容分析、内容总结
  • 推理,因果推理、常识推理、代码推理、数学推理
  • 安全,偏见、有害性、公平性、隐私性、真实性、合法性

工具层、方法层、能力层和模型层
在这里插入图片描述
OpenCompass评测工具包括:

  • CompassRank 中立全面的性能榜单
    大语言模型总榜单
    多模态总榜单

  • CompassKit 大模型评测全栈工具链

    • 数据污染检查
    • 更丰富的模型推理接入
    • 长文本能力评测
    • 中英文双语主观评测
      在这里插入图片描述
  • CompassHub 高质量评测基准社区
    开源开放,共建共享大模型评测,让更多的开发者参与到评测中,汇聚更多优质的数据

部署 LMDeploy

大模型部署的挑战
在这里插入图片描述
LMDeploy框架

  • 高效推理引擎,持续批量处理技巧,深度优化的低比特计算kernel,模型并行,高效的k/v缓存机制
  • 完备易用的工具链,量化、推理、服务全流程,无缝对接OpenCompass评测推理精度,与OpenAI接口高度兼容
  • 支持交互式推理,不为历史对话买单

在这里插入图片描述

智能体 Lagent

  • 支持多种类型的智能体能力,包括ReAct、ReWoo、AutoGPT
  • 灵活支持多种大语言模型,包括GPT-3.5/4、Llama、InternLM
  • 支持丰富的工具,包括AI工具(文生图、文生语音)、能力拓展(搜索、计算器、代码解释器)、Rapid API(出行API、财经API)
    在这里插入图片描述

智能体工具箱 AgentLego

  • 支持多模态任务
  • 支持主流智能体系统,LangChain、Transformers Agent、Lagent
  • 多模态工具接口

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1559084.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

亚马逊测评新策略:解决底层环境防关联,提升下单成功率

对于做测评的环境系统,确保稳定性和成功率是非常重要的。市面上有各种环境方案,如虚拟机、模拟机、gcs、云手机、VPS等。然而,这些方案不仅成本高,而且成功率很低。因此,一个好的环境系统是成功的基础。 亚马逊平台的…

算法学习——LeetCode力扣动态规划篇5(198. 打家劫舍、213. 打家劫舍 II、337. 打家劫舍 III )

算法学习——LeetCode力扣动态规划篇5 198. 打家劫舍 198. 打家劫舍 - 力扣(LeetCode) 描述 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统…

echarts 图表/SVG 图片指定位置截取

echarts 图表/SVG 图片指定位置截取 1.前期准备2.图片截取3.关于drawImage参数 需求&#xff1a;如下图所示&#xff0c;需要固定头部legend信息 1.前期准备 echarts dom渲染容器 <div :id"barchart id" class"charts" ref"barchart">&…

动态规划-----背包类问题(0-1背包与完全背包)详解

目录 什么是背包问题&#xff1f; 动态规划问题的一般解决办法&#xff1a; 0-1背包问题&#xff1a; 0 - 1背包类问题 分割等和子集&#xff1a; 完全背包问题&#xff1a; 完全背包类问题 零钱兑换II: 什么是背包问题&#xff1f; 背包问题(Knapsack problem)是一种…

jsp中设置动态时间

第一步 在head中写入meta <head><meta charset"UTF-8" http-equiv"Refresh" content"1"> </head> 第二步在head中写入函数 <head><meta charset"UTF-8" http-equiv"Refresh" content"…

Mac m1 Flink的HelloWorld

首先在官方下载Downloads | Apache Flink 下载好压缩包后解压&#xff0c;得到Flink文件夹 进入&#xff1a;cd flink-1.19.0 ls 查看里面的文件&#xff1a; 执行启动集群 ./bin/start-cluster.sh 输出显示它已经成功地启动了集群&#xff0c;并且正在启动 standalonesessio…

基于YOLOV8+Pyqt5光伏太阳能电池板目标检测系统

1、YOLOV8算法 YOLOv8 是当前效果较好的目标检测 算法&#xff0c;它的核心网络来源于 DarkNet-53&#xff0c;该网络初次在 YOLOv3[11] 中被引入&#xff0c;并深受 ResNet[12] 的影响。DarkNet-53 使用了残差机制&#xff0c;并连续添加了卷积模块来加强其功能性。 这 53 层…

AI 音乐的 “ChatGPT“ 时刻,SunoV3简介和升级教程

一句话总结 Suno AI音乐平台发布了V3版本&#xff0c;标志着AI音乐创作领域的一个重要进步&#xff0c;类似于ChatGPT在文本生成领域的影响。 关键信息点 Suno AI是专注于生成式AI音乐的平台&#xff0c;最新发布的V3版本在音质、咬字和节奏编排上有显著提升。V3版本的AI音乐…

集成百兆,千兆,万兆网络变压器等电子元器件的RJ45 Jack连接器在屏显控制系统中的应用

Hqst华轩盛(石门盈盛)电子导读&#xff1a;集成百兆&#xff0c;千兆&#xff0c;万兆网络变压器等电子元器件的RJ45 Jack连接器在屏显控制系统中的应用 一 ﹑集成百兆&#xff0c;千兆&#xff0c;万兆网络变压器等电子元器件的RJ45 Jack连接器在屏显控制系统中的应用前景 近年…

SQL Server 数据库常见提权总结

前面总结了linux和Windows的提权方式以及Mysql提权&#xff0c;这篇文章讲讲SQL Server数据库的提权。 目录 基础知识 权限判定 系统数据库 存储过程 常见系统存储过程 常见扩展存储过程 xp_cmdshell扩展存储过程提权 xp_dirtree写入文件提权 sp_oacreate提权 xp_re…

【吊打面试官系列】Redis篇 -Redis 如何做内存优化?

大家好&#xff0c;我是锋哥。今天分享关于 【Redis 如何做内存优化&#xff1f;】面试题&#xff0c;希望对大家有帮助&#xff1b; Redis 如何做内存优化&#xff1f; 尽可能使用散列表&#xff08;hashes&#xff09;&#xff0c;散列表&#xff08;是说散列表里面存储的数…

[ESP32]:基于esp-modbus实现serial从机

[ESP32]&#xff1a;基于esp-modbus实现serial从机 开发环境&#xff1a; esp idf 5.1esp-modbus 1.0.13 使用如下指令添加组件&#xff0c;或者访问esp-modbus idf.py add-dependency "espressif/esp-modbus^1.0.13"1.mb_register_area_descriptor_t 对于slave…

PHP远程命令执行与代码执行原理利用与常见绕过总结

PHP远程命令执行与代码执行原理利用与常见绕过总结 远程命令执行 相较于SQL注入漏洞&#xff0c;远程命令执行更加少见。由于是直接执行系统命令&#xff0c;所以相较于前者此漏洞会更加危险&#xff1a; 攻击者通过远程命令执行漏洞可以直接掌控服务器攻击者可以通过存在此…

OSCP靶场--Internal

OSCP靶场–Internal 考点(CVE-2009-3103) 1.nmap扫描 ## ┌──(root㉿kali)-[~/Desktop] └─# nmap 192.168.216.40 -sV -sC -Pn --min-rate 2500 -p- Starting Nmap 7.92 ( https://nmap.org ) at 2024-03-31 07:00 EDT Nmap scan report for 192.168.216.40 Host is up…

【微服务框架】微服务简介

个人名片&#xff1a; &#x1f43c;作者简介&#xff1a;一名大三在校生&#xff0c;喜欢AI编程&#x1f38b; &#x1f43b;‍❄️个人主页&#x1f947;&#xff1a;落798. &#x1f43c;个人WeChat&#xff1a;hmmwx53 &#x1f54a;️系列专栏&#xff1a;&#x1f5bc;️…

react ts 封装搜索条件

封装 import React, { ReactNode, useImperativeHandle, forwardRef } from react; import { Card, Form, Input, Button, Row, Col } from antd;interface Iprops {formItem: any,getParams: (params: any) > void,reset?: () > void | undefined,isButton?: boolean…

算法学习16:数论03(容斥原理、博弈论)

算法学习16&#xff1a;数论03&#xff08;容斥原理、博弈论&#xff09; 文章目录 算法学习16&#xff1a;数论03&#xff08;容斥原理、博弈论&#xff09;前言一、容斥原理&#xff1a;求多个集合的并集二、博弈论1.Nim游戏&#xff1a;2.集合N-im游戏 总结 前言 提示&#…

南京观海微电子---Vitis HLS设计流程介绍——Vitis HLS教程

1. 传统的FPGA设计流程 传统的RTL设计流程如下图所示&#xff1a; 传统的FPGA RTL设计流程主要是采用VHDL、VerilogHDL或System Verilog进行工程的开发&#xff0c;同时也是通过硬件描述语言来编写测试案例&#xff08;Test Bench&#xff09;对开发的工程进行仿真验证。 随后…

教你一键轻松领取腾讯云优惠券

随着云计算的普及&#xff0c;越来越多的企业和个人开始使用云服务。而在众多云服务提供商中&#xff0c;腾讯云凭借其优质的服务和丰富的产品赢得了广大用户的青睐。为了吸引更多的用户上云&#xff0c;腾讯云推出了优惠券活动&#xff0c;让用户在购买云服务时能够获得更多实…