书生浦语第一次课

书生浦语第一次课

news2025/4/4 18:31:22

模型的发展

从专业模型到通用模型
在这里插入图片描述

书生·浦语大模型全链路开源体系

2023.06.07 -> InternLM千亿参数语言大模型发布

2023.07.06 -> InternLM千亿参数语言大模型全面升级，支持8K语境、26种语言。全面开源、免费商用：InternLM-7B、全链条开源工具体系

2023.08.14 -> 书生·万卷1.0多模态预训练语料库开源发布

2023.08.21 -> 升级版对话模型InternLM-Chat-7B v1.1发布，开源智能体框架Lagent，支持从语言模型到智能体升级转换

2023.08.28 -> InternLM 千亿参数模型的参数两升级到123B

2023.09.20 -> 增强版InternLM-20B开源，开源工具链全线升级

回归语言模型本质

1、多维数据价值评价
基于文本质量、信息质量、信息密度等维度对数据简直进行综合评估和提升
2、高质量预料驱动的数据富集
利用高质量语料的特征从物理世界、互联网以及语料进一步富集耕读类似语料
针对性数据补齐
3、针对性补充语料
重点加强世界知识、数理、代码等核心能力
在这里插入图片描述

书生浦语特点

超长上下文
综合性能全面提升
优秀对话和创作体验
工具调用能力整体提升
突出的数理能力和使用的数据分析能力

在这里插入图片描述

模型到应用流程

在这里插入图片描述

书生浦语体系

数据
预训练
微调
全参微调和LORA微调
部署
评测
应用

在这里插入图片描述

微调

增量续训
使用场景：让基座模型学习到一些新知识，如某个垂类领域知识训练数据：文章、书籍、代码等
有监督微调
使用场景：让模型学会理解各种指令进行对话，或者注入少量领域知识训练数据：高质量的对话、问答数据
在这里插入图片描述

微调框架

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1563382.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【内存泄漏】数据库连接connectionPhantomRefs内存过大

【内存泄漏】数据库连接connectionPhantomRefs内存过大

1. 问题背景线上出现内存报警，内存增长曲线如下 dump内存文件，临时重新发布服务。后经排查发现是数据库连接池设置不合理以及mysql-connector-java 5.1.49有内存泄漏bug。以下为对此问题的分析及问题总结。 1.1 应用背景数据库连接池： …

阅读更多...

赛奥分离技术现已加入2024第13届生物发酵展

赛奥分离技术现已加入2024第13届生物发酵展

参展企业介绍上海赛奥分离技术工程有限公司成立于2010年,是上海市高新技术企业、上海市专精特新企业，宝山区工程及技术中心。公司着重于在流体分离净化领域，研究开发制造膜技术领域中错流微滤、超滤系统、纳滤系统、反渗透、精细过滤等膜分离设备及适用…

阅读更多...

光伏无人机：绿色能源与航空技术的融合创新

光伏无人机：绿色能源与航空技术的融合创新

在可再生能源和无人机技术快速发展的背景下，光伏无人机作为一种新兴的绿色航空器，正逐渐展现出其独特的优势和广阔的应用前景。本文将深入探讨光伏无人机的原理、优势以及其在多个领域的应用，展望其未来的发展趋势。一、光伏无人机的原理光…

阅读更多...

【LeetCode】热题100 刷题笔记

【LeetCode】热题100 刷题笔记

文章目录 T1 两数之和T49 字母异位词分组常用小技巧 T1 两数之和链接：1. 两数之和题目： 【刷题感悟】这道题用两层for循环也能做出来，但我们还是要挑战一下时间复杂度小于 O ( n 2 ) O(n^2) O(n2)的解法，不能因为它是第一道 …

阅读更多...

SAP Fiori开发中的JavaScript基础知识6 - 数组（Arrays）

SAP Fiori开发中的JavaScript基础知识6 - 数组（Arrays）

1 背景在本篇博客中，我将介绍JavaScript中数组（Arrays）的概念和用法。 2 数组在JavaScript中，数组是一种特殊的对象，用于存储多个值在单个变量中。 2.1 创建数组在JavaScript中，创建数组有以下有2种…

阅读更多...

鸿蒙OS元服务开发说明：【WebGL网页图形库开发接口】

鸿蒙OS元服务开发说明：【WebGL网页图形库开发接口】

一、场景介绍 WebGL主要帮助开发者在前端开发中完成图形图像的相关处理，比如绘制彩色图形等。目前该功能仅支持使用兼容JS的类Web开发范式开发。二、接口说明表1 WebGL主要接口列表鸿蒙OS开发更多内容↓点击HarmonyOS与OpenHarmony技术鸿蒙技术文档开发知识更…

阅读更多...

反弹shell的方法和场景

反弹shell的方法和场景

Netcat反弹Shell 1 NC正向反弹shell Netcat简称NC,是一个简单、可靠的网络工具,被誉为网络界的瑞士军刀。通NC可以进行端口扫描、反弹Shell、端口监听和文件传输等操作,常用参数如下： -c指定连接后要执行的shell命令-e指定连接后要执行的文件名-k配置 Socket一…

阅读更多...

制造业工厂怎么通过MES系统来升级改造车间管理

制造业工厂怎么通过MES系统来升级改造车间管理

在当今高度竞争的市场环境下，制造业企业需要不断提高生产效率，以在激烈的竞争中立于不败之地。而一种被广泛应用的方法就是利用MES控制系统，通过数字化管理和自动化控制来改造生产车间提升生产效率。 1、MES管理系统能够实现对生产过程的全面…

阅读更多...

Linux环境基础和工具的使用

Linux环境基础和工具的使用

目录 1、Linux软件包管理器---yum 2、Linux开发工具 2.1、vim基本概念 2.2 vim基本操作 2.3 vim正常模式命令集 2.4 vim末行模式命令集 2.5 简单vim配置 2.5.1 配置文件的位置 3 Linux编译器--gcc/g的使用 3.1 背景知识 3.2 gcc完成 4 Linux调试器--gdb使用 4.1 背…

阅读更多...

网页的血液——javascript

网页的血液——javascript

JavaScript 基础知识概述 1. JavaScript 介绍 JavaScript 是一种高级的、解释型的编程语言，它是一种基于对象的、事件驱动的语言，它允许开发者创建动态的网页。JavaScript 是一种脚本语言，它可以嵌入到 HTML 中，或者作为外部文件…

阅读更多...

一篇商业稿件值千元，我的过稿经验大公开

一篇商业稿件值千元，我的过稿经验大公开

撰写过上百篇企业和品牌稿件，甚至一篇商业稿件可值千元，可能很多人还不太相信，事实就是真的会有很多的企业和品牌愿意为此买单，是因为稿件带来的价值也是无法衡量的，直接给产品或是品牌带来更多的曝光甚至转化。今天伯…

阅读更多...

一种新的基于STT-MRAM的时域内存计算单元

一种新的基于STT-MRAM的时域内存计算单元

大数据、物联网和人工智能等技术的进步揭示了传统冯诺依曼的瓶颈架构，导致高能耗和有限的内存带宽。内存计算（IMC通过直接在内存中进行计算，提高了能效，提供了一个有前景的解决方案计算。现有的基于时域（TD&#xff09…

阅读更多...

vue+elementUI搭建动态表头的表格

vue+elementUI搭建动态表头的表格

前提：以下代码是vue2项目结合elementUi完成的数据结构后端传来的数据是两个list，一个表头的list，一个表格内容的list // 表头 headTableAtts: [{ columnLabel: 姓名, columnName: name },{ columnLabel: 年龄, columnName: age },{ colu…

阅读更多...

算法学习——LeetCode力扣动态规划篇4（377. 组合总和 Ⅳ、322. 零钱兑换、279. 完全平方数、139. 单词拆分）

算法学习——LeetCode力扣动态规划篇4（377. 组合总和 Ⅳ、322. 零钱兑换、279. 完全平方数、139. 单词拆分）

算法学习——LeetCode力扣动态规划篇4 377. 组合总和 Ⅳ 377. 组合总和 Ⅳ - 力扣（LeetCode） 描述给你一个由不同整数组成的数组 nums ，和一个目标整数 target 。请你从 nums 中找出并返回总和为 target 的元素组合的个数。题目数据保…

阅读更多...

苹果手机系统文件浏览技巧：实现高效的文件查找与管理

苹果手机系统文件浏览技巧：实现高效的文件查找与管理

目录引言用户登录工具和连接设备查看设备信息，电池信息查看硬盘信息硬件信息查看基带信息销售信息电脑可对手机应用程序批量操作运行APP和查看APP日志 IPA包安装测试注意事项引言苹果手机与安卓手机不同，无法直接访问系统文件…

阅读更多...

透明表的自增ID

透明表的自增ID

透明表的自增ID

阅读更多...

linux shell命令（进程管理、用户管理）

linux shell命令（进程管理、用户管理）

一、进程的概念主要有两点： 1.进程是一个实体。每一个进程都有它自己的地址空间，一般情况下，包括文本区域（text region）、数据区域（data region）和堆栈（stack region）…

阅读更多...

浅显易懂的简单说一下jvm内存模型

浅显易懂的简单说一下jvm内存模型

说起JVM大家都知道，它是运行java代码的基础。那么关于JVM 内存模型是不是很模糊我用通俗易懂的方式说一下我们这里先介绍 JVM 堆内存它有两大块包括新生代内存，和老年代内存。为啥分为这两块， 你可以这样理解，&#xff…

阅读更多...

【图论】【拓扑排序】1857. 有向图中最大颜色值

【图论】【拓扑排序】1857. 有向图中最大颜色值

本文涉及的知识点图论拓扑排序 LeetCode1857. 有向图中最大颜色值给你一个有向图 ，它含有 n 个节点和 m 条边。节点编号从 0 到 n - 1 。给你一个字符串 colors ，其中 colors[i] 是小写英文字母，表示图中第 i 个节点的颜色 &#xf…

阅读更多...

代码随想录算法训练营DAY14|C++二叉树Part.1|二叉树的递归遍历、二叉树的迭代遍历、二叉树的统一迭代法

代码随想录算法训练营DAY14|C++二叉树Part.1|二叉树的递归遍历、二叉树的迭代遍历、二叉树的统一迭代法

文章目录二叉树的递归遍历思路CPP代码二叉树的迭代遍历思路前序遍历后序遍历后序遍历二叉树的统一迭代法二叉树的递归遍历 144.二叉树的前序遍历、145.二叉树的后序遍历、94.二叉树的中序遍历文章讲解：二叉树的递归遍历视频讲解：每次写递归都要靠直…

阅读更多...

推荐文章

最新文章