书生.浦江大模型实战训练营——(四)书生·浦语大模型全链路开源开放体系

news2025/1/12 9:44:38

最近在学习书生.浦江大模型实战训练营,所有课程都免费,以关卡的形式学习,也比较有意思,提供免费的算力实战,真的很不错(无广)!欢迎大家一起学习,打开LLM探索大门:邀请连接,PS,邀请有算力哈哈

任务

观看本关卡的视频与官网后,写下关于书生大模型全链路开源开放体系的笔记。

书生·浦语大模型全链路开源开放体系

  • 一、体系概述
  • 二、发展历程
  • 三、最新版本特性:书生·浦语大模型2.5

视频时长约30分钟,内容涵盖了书生·浦语大模型的全链路开发体系及其关键技术,学到的东西很多。接下来我会继续研究知识图谱、检索增强生成以及基于图神经网络的长文本处理,期待大家一起交流!以下是对此视频内容的详细总结。

一、体系概述

书生·浦语大模型全链路开源开放体系旨在构建一个包括数据收集、模型训练、微调、评测以及AI应用部署的完整生态。通过开源代码和项目,推动了人工智能的普及与实际应用,使得研究者和开发者能更高效地利用和开发基于大模型的应用。

在这里插入图片描述

二、发展历程

  1. 开源开放体系的建立:书生·浦语大模型自始便重视开源,通过发布开源项目吸引了众多开发者和研究者的参与。这种开放的形式加快了模型的迭代与优化。

  2. 数据收集与整理:该模型在数据驱动的过程中,采用多种数据生成方式,包括基于规则、模型以及反馈的数据生成。这提高了数据的多样性,增强了模型的推理能力及短期记忆。

  3. 反馈机制的引入:引入相似度对齐与基于反馈的强化训练后,模型在理解用户需求方面的表现有所提升,进而提高了准确性和用户满意度。

在这里插入图片描述

三、最新版本特性:书生·浦语大模型2.5

  1. 性能提升:在最新版本的书生·浦语大模型2.5中,推理能力和短期记忆等方面得到了显著提升,从而在处理复杂问题时更快速且准确。

  2. Label LLM项目开源:为了简化数据标注过程,书生团队开源了Label LLM项目,提供了高效的数据标注解决方案,进而促进后续模型的训练和优化。

  3. 性能评测体系:视频中的性能天梯展示了通过各种评测工具对模型进行实时性能监测和比较的方法,为模型的持续优化提供了依据。

在这里插入图片描述

以下是一段简单的internLM推理代码示例:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name_or_path = "/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')
model = model.eval()

system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""

messages = [(system_prompt, '')]

print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")

while True:
    input_text = input("\nUser  >>> ")
    input_text = input_text.replace(' ', '')
    if input_text == "exit":
        break

    length = 0
    for response, _ in model.stream_chat(tokenizer, input_text, messages):
        if response is not None:
            print(response[length:], flush=True, end="")
            length = len(response)

希望这些内容能对大家理解书生·浦语大模型有所帮助!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1994308.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

60、排列序列,61、旋转链表——LeetCode

60、排列序列 题目 给出集合 [1,2,3,...,n],其所有元素共有 n! 种排列。 按大小顺序列出所有排列情况,并一一标记,当 n 3 时, 所有排列如下: "123" "132" "213" "231" "312…

c#--有关DataGridView表格控件绑定数据源后的无数据、无法更新、闪烁及如何绑定图片等问题的总结

使用绑定数据源的方式绑定数据 1.DataGridview.Rows.Clear(),提示“不能清除此列表”。 用数据源绑定的DataGridView不能用Rows.Clear()清除,手动添加的是能够用clear()的。所以将datasource设置为null就可以清空数据。 2.DataSource为NULL&#xff0…

IP地址封装类(InetAddress类)

文章目录 前言一、IP地址是什么?二、IP地址封装类 1.常用方法2.实操展示总结 前言 当我们想要获取到通信对方的IP地址、主机地址等信息时,我们可以使用InetAddress类。InetAddress类在java的net包中。 一、IP地址是什么? IP地址 (Internet Pr…

人工智能算法岗找实习经验(一)简历撰写

首先分享简历撰写,下面简历仅供参考。 分为教育经历、个人能力、项目经历和竞赛经历4个部分。因为找的是算法岗,所以没有涉及太多技术和项目之外的东西。 教育经历 教育经历就是简单介绍下大学、专业、GPA还有就是和人工智能算法岗相关的专业课。 个…

【Python-实操】LabelMe to YOLOv8 Converter

LabelMe to YOLOv8 Converter 这是一个 Python 脚本,用于将 LabelMe 标注工具导出的 JSON 文件转换为 YOLOv8 格式的标注文件,并同时在图像上绘制标注的多边形。 功能 读取 LabelMe JSON 文件。解码并显示图像。从 classes.txt 文件加载类别标签。将多…

超有效!这样选的宠物空气净化器真能去浮毛?一款家电助力呼吸道

我那哥们儿,最近家里多了个毛茸茸的小成员——一只小猫。他对这猫好得不得了,俩人几乎是形影不离。可问题来了,小猫一长大,那毛啊,掉得满屋子都是。哥们儿最近就老抱怨,说晚上睡觉喉咙不舒服,问…

LVS是什么?以及LVS-NAT以及DR模式实验

目录 NAT LVS LVS集群的类型: LVS-NAT模式实验 环境准备: 实验步骤: LVS-DR模式实验 题目: 环境准备: 实验步骤: LVS-防火墙标签解决轮询调度问题 环境准备: 实验步骤&#xff1…

springboot疫情隔离酒店管理系统的开发--论文源码调试讲解

1系统成功运行案例 2 相关技术介绍 2.1 B/S模式 B/S模式是一种比较常用的网络结构模式[7]。B/S模式是由MVC结构组成,即模型、视图、控制器是构成该模式的主要结构[8]。模型主要是指业务模型,视图是面向用户而显示的相关界面,控制器主要是控制…

使用 defineNuxtComponent`定义 Vue 组件

title: 使用 defineNuxtComponent定义 Vue 组件 date: 2024/8/9 updated: 2024/8/9 author: cmdragon excerpt: 摘要:本文介绍了在Nuxt 3中使用defineNuxtComponent辅助函数定义类型安全的Vue组件的方法,适用于习惯Options API的开发者。defineNuxtCo…

【Deep-ML系列】Feature Scaling Implementation(特征缩放:standardization min-max)

题目链接:Deep-ML import numpy as np def feature_scaling(data: np.ndarray) -> (np.ndarray, np.ndarray):mean np.mean(data, axis0)std np.std(data, axis0)standardized_data (data - mean) / stdmaxnum np.max(data, axis0)minnum np.min(data, axi…

嵌入式人工智能(OpenCV-基于树莓派的人脸识别与入侵检测)

1、人脸识别 人脸识别是一种技术,通过检测、跟踪和识别人脸上的关键特征,以确认人脸的身份。它通常用于安保系统、身份验证、社交媒体和人机交互等领域。 人脸识别技术的基本原理是先通过图像处理和计算机视觉算法,提取人脸的特征点和特征描…

代理模式Proxy

一、代理模式(Proxy) 1.代理模式的定义 代理模式给某一个对象提供一个代理对象,并由代理对象控制对真实对象的访问,起到对代理对象已有功能的增强 通俗的来讲代理模式就是我们生活中常见的中介。 2.作用 中介隔离作用&#x…

2024 年的 Node.js 生态系统

数据来源于 Node.js Toolbox,网站展示了 Node.js 生态系统中积极维护且流行的库。

在 Duo S 上使用 TDL SDK 高效部署人脸检测模型

TDL SDK 是一款集成算法开发包,提供了便捷的编程接口,使开发者们能够更快、高效地将各种深度学习技术应用于自己的产品和服务中。无论开发者是否是深度学习领域的专家,有了TDL SDK作为助手,都能轻松构建智能应用。 Milk-V DuoS 是…

7.4.分支限界法概率算法近似算法数据挖掘算法智能优化算法

了解,没有考过,基本上不会考 分支限界法 分支限界法:与回溯法类似,同样是在问题的解空间树上搜索问题解的一种算法,它常以广度优先或以最小耗费(最大效益)优先的方式搜索问题的解空间树。回溯…

【AI大模型】LangChain框架:示例选择器与输出解析器携手,编织NLP高效精准之网

文章目录 前言一、示例选择器1.介绍及应用2.自定义示例选择器案例:AI点评姓名 3.基于长度的示例选择器案例:对输入内容取反 4.基于最大边际相关性(MMR)的示例选择器案例:得到输入的反义词 5.基于n-gram重叠的示例选择器6.综合案例 二、输出解…

深入探索String AOP想详情

一.AOP的概述 AOP是Spring框架的第⼆⼤核⼼(第⼀⼤核⼼是IoC) Q:什么是AOP? A:Aspect Oriented Programming(⾯向切⾯编程) 什么是⾯向切⾯编程呢? 切⾯就是指某⼀类特定问题, 所以AOP也可以理解为⾯向特定⽅法编程. 什么是⾯向特…

鸿蒙HarmonyOS开发:@Observed装饰器和@ObjectLink装饰器:监听嵌套类对象属性变化

文章目录 一、装饰器二、概述三、限制条件四、装饰器说明五、Toggle组件1、子组件2、接口3、ToggleType枚举4、事件 六、示例演示1、代码2、效果 一、装饰器 State装饰器:组件内状态Prop装饰器:父子单向同步Link装饰器:父子双向同步Provide装…

Linux云计算 |【第二阶段】NETWORK-DAY1

主要内容: 计算机网络概述、网络拓扑结构、OSI参考模型、eNSP、交换机及原理 一、计算机网络概述 计算机网络是指将多台计算机或设备通过通信线路连接起来,以便它们能够相互交换信息和共享资源的系统。计算机网络的目的是实现数据通信和资源共享&#…

生成式人工智能安全评估体系构建

文章目录 前言一、人工智能安全治理的现状1.1 国际安全治理现状1.2 国内安全治理现状二、构建人工智能安全评估体系1.1 需要对生成式人工智能技术的安全性、可靠性、可控性、公平性等维度进行全面的考量。1.2 应对生成式人工智能全维度风险。1.3 在体系化应对框架中,应明确法律…