书生·浦语大模型实战营(第二期)-书生·浦语大模型全链路开源体系

书生·浦语大模型实战营(第二期)-书生·浦语大模型全链路开源体系

news2025/7/16 11:05:09

课程来源：书生·浦语大模型全链路开源体系

1.大模型成为发展通用人工智能的重要途径

专用模型:针对特定任务,一个模型解决一个问题

通用大模型:一个模型应对多种任务、多种模态

2.书生·浦语大模型开源历程

书生·浦语2.0面向不同的使用需求,每个规格包含三个模型版本:InternLM2-Base、InternLM2和InternLM2-Chat

3.回归语言建模的本质

多维度数据价值评估:基于文本质量、信息质量、信息密度等维度对数据价值进行综合评估与提升

高质量语料驱动的数据富集:利用高质量语料的特征从物理世界、互联网以及语料库进一步富集更多类似语料

有针对性的数据补齐:针对性补充语料,重点加强世界知识，数量、代码等核心能力

4.书生·浦语2.0 的主要亮点

超长上下文

综合性能全面提升

优秀的对话和创作体验

工具调用能力整体升级

突出的数理能力和实用的数据分析功能

5.从模型到应用

智能客服

个人助手

行业应用

6.从模型到应用典型流程

7.书生·浦语全链条开源开放体系

数据:书生·万卷 2TB数据

预训练:InternLM-Train 并行训练

微调:XTuner 全参数微调低成本微调

部署:LMDeploy 全链路部署

评测:OpenCompass 全方位评测

应用:Lagent AgentLego 支持多种智能体代码解释器

7.1 数据

书生·万卷1.0:总数据量2TB；多模态融合；精细化处理；价值观对齐

书生·万卷CC:总数据量：400GB；时间跨度长；来源丰富多样；安全密度高

7.2 预训练

高可扩展；极致性能优化；兼容主流；开箱即用

7.3 微调

增量续训：让基座模型学习到一些新知识

有监督微调：让模型学会理解各种指令进行对话或注入少量领域知识训练数据

7.4 部署

LMDeploy提供大模型在GPU上部署的全流程解决方案，包括模型轻量化、推理和服务。

高效推理引擎

完备易用的工具链

支持交互式推理不为历史对话买单

7.5 评测

1月30日 OpenCompass 2.0司南大模型评测体系正式发布

7.6 智能体

轻量级智能体框架Lagent：灵活支持多种大语言模型简单易扩展，支持丰富的工具

多模态智能体工具箱 AgentLego

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1561536.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

golang语言系列：Authentication、OAuth、JWT 认证策略

golang语言系列：Authentication、OAuth、JWT 认证策略

云原生学习路线导航页（持续更新中） 本文是 golang语言系列文章，主要对编程通用技能 Authentication、OAuth、JWT 认证策略进行学习 1.Basic Authentication认证每个请求都需要将用户名密码进行base64编码后，放在请求头的Aut…

阅读更多...

04-MySQL数据库-权限管理

04-MySQL数据库-权限管理

一、查看权限 1，查看系统所有权限 mysql> show privileges; 权限字段介绍 privileges #权限名称 context #对象，表示可以对数据库，那些资源、进行哪些操作； comment #描述，备注解释说明； Grant…

阅读更多...

C++刷题篇——04找等值元素

C++刷题篇——04找等值元素

一、题目二、解题思路 1、分割后放进二维数组 2、使用map，key为数值，value为其坐标 3、遍历二维数组元素，再在map中找该元素对应的value值（二维数组形式），倘若value.size为1，那直接返回-1&…

阅读更多...

稳定性生产总结

稳定性生产总结

本期我们来谈下稳定性生产这个话题，稳定性建设目标有两个：降发生、降影响， 在降发生中的措施是做到三点：系统高可用、高性能、高质量，三高问题确实是一个很热的话题，里面涉及很多点。在降影响中要做到…

阅读更多...

数据结构03：栈、队列和数组队习题01[C++]

数据结构03：栈、队列和数组队习题01[C++]

考研笔记整理~🥝🥝 之前的博文链接在此：数据结构03：栈、队列和数组_-CSDN博客~🥝🥝 本篇作为链表的代码补充，供小伙伴们参考~🥝🥝 第1版：王道书的课后习题…

阅读更多...

Mamba和状态空间模型(SSM)的视觉指南：替代 Transformers 的语言建模方法

Mamba和状态空间模型(SSM)的视觉指南：替代 Transformers 的语言建模方法

原文地址： A Visual Guide to Mamba and State Space Models 2024 年 2 月 19 日论文地址：https://arxiv.org/pdf/2312.00752.pdf 这篇论文介绍了一种新型的线性时间序列模型Mamba，它通过选择性状态空间（Selective State Space…

阅读更多...

【Redis持久化】RDB、ROB介绍和使用

【Redis持久化】RDB、ROB介绍和使用

RDB、ROB介绍和使用引言ROB介绍配置指令介绍使用指令：dump文件修复指令快照禁用 AOF工作流程：文件重写：三种写回策略： 混合使用引言持久化的目的，其实就是在Redis重启或者中途崩溃的时候能够依靠自身恢复数据&…

阅读更多...

953: 单链表的删除操作的实现

953: 单链表的删除操作的实现

学习版【C语言】【C】 #include <iostream>class MyLinkedList{public:struct LinkedNode{int val;LinkedNode* next;LinkedNode(int x):val(x),next(NULL){};}; MyLinkedList(){dummyHeadnew LinkedNode(0);length0;}~MyLinkedList(){while (dummyHead){LinkedNode…

阅读更多...

vulhub打靶记录——driftingbox

vulhub打靶记录——driftingbox

文章目录主机发现端口扫描目录扫描爆破子域名提权总结主机发现使用nmap扫描局域网内存活的主机，命令如下： nmap -sP 192.168.56.0/24192.168.56.1：主机IP；192.168.56.100：DHCP服务器IP；192.168.56.101…

阅读更多...

代码随想录第二十六天 | 回溯算法P3 |● 39. ● 40.● 131.

代码随想录第二十六天 | 回溯算法P3 |● 39. ● 40.● 131.

39. 组合总和给你一个无重复元素的整数数组 candidates 和一个目标整数 target ，找出 candidates 中可以使数字和为目标数 target 的所有不同组合 ，并以列表形式返回。你可以按任意顺序返回这些组合。 candidates 中的同一个数字可以无限制重…

阅读更多...

windows下部署llama.cpp

windows下部署llama.cpp

下载cmake 下载地址解压，设置Path环境变量D:\CMake\bin 打开cmd输入cmake -version 安装mingw powershell下执行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser iex "& {$(irm get.scoop.sh)} -RunAsAdmin" scoop bucket add extras s…

阅读更多...

蓝桥杯算法题——暴力枚举法

蓝桥杯算法题——暴力枚举法

先估算这个数小于3的50次方 cnt0 for i in range(50):for j in range(50):for k in range(50):a3**ib5**jc7**kif a*b*c<59084709587505:cnt1 print(cnt-1)#当ijk都为0时，a*b*c1不是幸运数字所以要减去

阅读更多...

C++笔记：命名空间

C++笔记：命名空间

引入： 平常，我们在进行C编写时，一般我们都会默认在开始去写这样的代码： #include<iostream>//包含头文件using namespace std;//展开命名空间这里就出现了与C语言不同的地方：这里的命名空间就是C对于C语言进…

阅读更多...

深度学习| DiceLoss解决图像数据不平衡问题

深度学习| DiceLoss解决图像数据不平衡问题

图像数据不平衡问题图像数据不平衡：在进行图像分割时，二分类问题中，背景过大，前景过小；多分类问题中，某一类别的物体体积过小。在很多图像数据的时候都会遇到这个情况，尤其是在医学图像处理的…

阅读更多...

如何快速掌握数字化运维方法，构建数字化运维体系？

如何快速掌握数字化运维方法，构建数字化运维体系？

⛳️ 写在前面参与规则！！！ ✅参与方式：关注博主、点赞、收藏、评论，任意评论（每人最多评论三次） ⛳️本次送书1~4本【取决于阅读量，阅读量越多，送的越多】主要内容读者…

阅读更多...

操作符：左移（＜＜）右移（＞＞）

操作符：左移（＜＜）右移（＞＞）

在介绍移位操作符前，我们先介绍一下原码反码和补码这里要讲的左移和右移牵扯到原码补码和反码， 原码即这个整数转化为2进制时的一串， 正整数的原码、反码、补码相同， 10（int类型）的原码：00…

阅读更多...

day4 linux上部署第一个nest项目（java转ts全栈/3R教室）

day4 linux上部署第一个nest项目（java转ts全栈/3R教室）

背景：上一篇吧nest-vben-admin项目，再开发环境上跑通了，并且build出来了dist文件，接下来再部署到linux试试吧 dist文件夹是干嘛的？ 一个pnpn install 直接生成了两个dist文件夹，前端admin项目一个&#xf…

阅读更多...

黑马鸿蒙笔记 3

黑马鸿蒙笔记 3

目录 11.ArkUI组件-Column和Row 12.ArkUI组件-循环控制 13.ArkUI组件-List 14.ArkUI组件-自定义组件 15.ArkUI组件-状态管理State装饰器 16.ArkUI组件-状态管理-任务统计案例 17.ArkUI组件-状态管理-PropLinkProvideConsume 11.ArkUI组件-Column和Row Colum和Row的交叉…

阅读更多...

力扣-python-故障键盘

力扣-python-故障键盘

题解： from collections import dequeclass Solution:def finalString(self, s: str) -> str:# 创建一个双端队列用于存储字符q deque()# 定义一个标志位，用于标记当前字符应该添加到队列的哪一端head False# 遍历输入的字符串s的每一个字符for ch…

阅读更多...

k8s安装traefik作为ingress

k8s安装traefik作为ingress

一、先来介绍下Ingress Ingress 这个东西是 1.2 后才出现的，通过 Ingress 用户可以实现使用 nginx 等开源的反向代理负载均衡器实现对外暴露服务，以下详细说一下 Ingress，毕竟 traefik 用的就是 Ingress 使用 Ingress 时一般会有三个组件: …

阅读更多...

推荐文章

最新文章