书生·浦语训练营二期第一次笔记

news2025/1/17 14:07:21

文章目录

  • 书生·浦语大模型全链路开源体系视频笔记
    • Intern2模型体系
  • 训练数据集
  • 书生浦语全链条开源开放体系
    • 开放高质量语料数据
    • 预训练
    • 微调
    • 中立全面性能榜单
    • 大模型评测全栈工具链
    • 部署

  1. 书生·浦语大模型全链路开源体系-Bilibili视频
  2. InternLM2技术报告(中文)
  3. InternLM2技术报告(英文)

书生·浦语大模型全链路开源体系视频笔记

Intern2模型体系

在这里插入图片描述

InternLM2开放了多个版本的模型:

  • InternLM2-Base:高质量、强可塑性的基座模型。

  • InternLM2:在Base基础上,在多个能力进行了强化,更优秀的基座模型。(看InternLM技术报告似乎是进行了增强训练Enhancement Training

  • InternLM2-Chat:在Base基础上,再经过SFT和RLHF对齐后的对话模型。面向对话交互进行了优化,具有良好的指令遵循能力。

训练数据集

在这里插入图片描述
采用多种创造性方法,清洗和过滤数据集。

书生浦语全链条开源开放体系

在这里插入图片描述
我们能利用书生·浦语的框架,完整的开发属于自己的大模型应用。相对于第一期,InternLM2增加了Lagent和AgentLego。

开放高质量语料数据

在这里插入图片描述

预训练

在这里插入图片描述

微调

在这里插入图片描述
在这里插入图片描述

中立全面性能榜单

在这里插入图片描述

大模型评测全栈工具链

在这里插入图片描述

在这里插入图片描述

加入循环评测策略,先前的评测方案是做多选题,模型可能存在猜测的因素。而循环评测是对选项进行轮换,只有在能够答对所有轮换的选项后才能说明它的回答是正确的。

部署

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1557654.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#基础知识总结

C语言、C和C#的区别 ✔ 面向对象编程(OOP): C 是一种过程化的编程语言,它不直接支持面向对象编程。然而,C 是一种支持 OOP 的 C 的超集,它引入了类、对象、继承、多态等概念。C# 是完全面向对象的&#xff…

酷柚易讯无人空间小程序注册后需开通的部分接口权限

注意:无人共享小程序注册认证与备案后,需要开通以下接口系统才能正常使用! 登录小程序后,找到开发管理->接口设置(申请对应的接口权限)

设计模式10--适配器模式

定义 案例一 案例二 优缺点

用html实现一个手风琴相册设计

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>手风琴相册设计</title><link rel"stylesheet" href"./style.css"> </head> <body> <h1>Accordio…

S7-1500PLC与ABB机器人RobotStudio调试演示

(1)建立空工作站 (2)选择机器人、导入吸盘、托盘、传送带 (3) 将导入的吸盘变为工具 (4)创建机器人系统 布局如下 (5)创建物体 (6)设置物体本地原点 (7)创建传送带Smart组件 (8)创建吸盘Smart组件 将吸盘的传感器拖到吸盘上 (9)示教目标点 (10)同步示教点 (11)添加信号 创建…

汽车租赁(源码+文档)

汽车租赁&#xff08;小程序、ios、安卓都可部署&#xff09; 文件包含内容程序简要说明含有功能项目截图客户端登录界面首页订单个人信息我的界面新手指引注册界面车型选择支付界面修改信息 管理端用户管理订单管理分类管理 文件包含内容 1、搭建视频 2、流程图 3、开题报告 …

Uibot6.0 (RPA财务机器人师资培训第4天 )批量开票机器人案例实战

类似于小北之前发布的一篇博客&#xff08;不能说很像&#xff0c;只能说是一模一样&#xff09; Uibot (RPA设计软件&#xff09;财务会计Web应用自动化(批量开票机器人&#xff09;-CSDN博客https://blog.csdn.net/Zhiyilang/article/details/136782171?spm1001.2014.3001.…

搜索与图论——染色法判定二分图

一个图是二分图当且仅当这个图中不含奇数环 由于图中没有奇数环&#xff0c;所以染色过程中一定没有矛盾 所以一个二分图一定可以成功被二染色&#xff0c;反之在二染色的过程中出现矛盾的图中一定有奇数环&#xff0c;也就一定不是二分图 #include<iostream> #includ…

Unity LineRenderer的基本了解

在Unity中&#xff0c;LineRenderer组件用于在场景中绘制简单的线条。它通常用于绘制轨迹、路径、激光等效果。 下面来了解下它的基本信息。 1、创建 法1&#xff1a;通过代码创建 using UnityEngine;public class CreateLineRenderer : MonoBehaviour {void Start(){// 创…

C# wpf 嵌入winform控件

WPF Hwnd窗口互操作系列 第一章 嵌入Hwnd窗口 第二章 嵌入WinForm控件&#xff08;本章&#xff09; 第三章 嵌入WPF控件 第四章 底部嵌入HwndHost 文章目录 WPF Hwnd窗口互操作系列前言一、导入WinForm1、.Net Framwork&#xff08;1&#xff09;、右键添加引用&#xff08;2…

Linux:对TCP阻塞控制/面向字节流/异常的理解

文章目录 阻塞控制面向字节流TCP链接异常 本篇总结TCP的最后一点小知识 阻塞控制 首先对于阻塞控制的概念是&#xff0c;它是和网络环境息息相关的 如果在发送数据的时候出现问题&#xff0c;不仅仅是由于对方链接出错&#xff0c;其实还和当前的网络情况有关&#xff0c;假…

金三银四面试题(八):JVM常见面试题(2)

今天我们继续探讨常见的JVM面试题。这些问题不比之前的问题庞大&#xff0c;多用于面试中​JVM部分的热身运动&#xff0c;开胃菜&#xff0c;但是大家已经要认真准备。 JRE、JDK、JVM 及JIT 之间有什么不同&#xff1f; JRE 代表Java 运行时&#xff08;Java run-time&#…

javaWeb项目-高校大学社团活动平台功能介绍

项目关键技术 开发工具&#xff1a;IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架&#xff1a;ssm、Springboot 前端&#xff1a;Vue、ElementUI 关键技术&#xff1a;springboot、SSM、vue、MYSQL、MAVEN 数据库工具&#xff1a;Navicat、SQLyog 1、JSP技术 JSP(Jav…

机器视觉/将HIK海康面阵相机连接Halcon软件

文章目录 概述工业相机客户端动态库拷贝Halcon连接HIK相机的配置相机参数其他 概述 本文简述了如何将海康面阵相机连接到Halcon软件中进行实时取图的过程。 补充&#xff0c; 整个实践过程使用 17.12 / x64-win64 Halcon 软件版本 海康 MV-CE200-10GM 面阵相机。从左到右简解…

阿里云轻量应用服务器优惠价格表,61元和165元一年

阿里云轻量应用服务器2核2G和2核4G配置优惠价格表&#xff0c;轻量2核2G3M带宽61元一年&#xff0c;轻量2核4G4M带宽165元1年&#xff0c;均不限制月流量&#xff0c;阿里云活动链接 aliyunfuwuqi.com/go/aliyun 活动打开如下图&#xff1a; 阿里云轻量应用服务器价格 61元/年…

【DA-CLIP】使用train.py训练

背景 【DA-CLIP】生成图像描述generate_captions.py代码理解实践-CSDN博客https://blog.csdn.net/m0_60350022/article/details/137180758?spm1001.2014.3001.5502生成csv文件 参考md. 条件有限我只看单GPU训练的,还有一个四GPU的分布训练配置 cd ./src python -m training.…

vlanif三层交换机实现不同网络通信

实验目的&#xff1a;通过三层交换机实现不同 网络通信&#xff0c;之前都是路由器进行不同网络转发 拓扑图 内容&#xff1a;左边vlan10&#xff0c;右边vlan20 lsw1接口通过所有vlan lsw2网路vlan10 lsw3网络vlan20 问题点&#xff1a;开始只是配置了最上面LSW1的交换机…

【Node.js】图片验证码识别

现在越来越多的网站采取图片验证码&#xff0c;防止机器恶意向服务端发送请求。但是常规的图片验证码也不是非常安全了。有非常多第三方库可以对图片上的数字文字等进行识别。 代码实现 首先安装依赖&#xff1a; npm install node-native-ocrnpm&#xff1a;(node-native-oc…

基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计——综述

综述 本文对基于视觉的机器人抓取进行了全面的综述。我们总结了基于视觉的机器人抓取过程中的三个关键任务&#xff0c;即物体定位、物体姿态估计和抓取估计。详细地说&#xff0c;对象定位任务包括无分类的对象定位、对象检测和对象实例分割。此任务提供输入数据中目标对象的…

神经网络 各个模块介绍(Pytorch 07)

一 网络层和块 单个神经网络&#xff08;1&#xff09;接受一些输入&#xff1b;&#xff08;2&#xff09;生成相应的标量输出&#xff1b;&#xff08;3&#xff09;具有一组相关 参数&#xff08;parameters&#xff09;&#xff0c;更新这些参数 可以优化某目标函数。 当…