【AI落地应用实战】Amazon SageMaker JumpStart 体验零一万物的 Yi 1.5 模型

news2024/9/20 0:10:22

目录

  • 一、前言
    • 1.1、Amazon SageMaker JumpStart
    • 1.2、Yi-1.5 9B Chat 模型
  • 二、Yi 1.5实践流程
    • 2.1、准备SageMaker Studio环境
    • 2.2、部署Yi-1.5-9B模型
    • 2.3、运行推理Yi-1.5-9B模型
  • 三、体验总结

中国大模型公司零一万物发布开源大模型Yi-1.5,包含多个版本。同时发布多款模型API接口,其中Yi-Large模型性能卓越,已进军全球顶级大模型之首。零一万物还启动下一代模型训练,旨在冲击GPT-5性能。

本篇文章将介绍 Amazon SageMaker JumpStart 快速部署 Yi-1.5 9B Chat 模型实践。

一、前言

1.1、Amazon SageMaker JumpStart

Amazon SageMaker JumpStart 是 Amazon SageMaker 平台的一部分,旨在帮助用户更快、更轻松地启动和开发机器学习项目。这是亚马逊云科技提供的一个非常实用的工具,特别适合那些希望迅速启动和开发机器学习项目的用户。

SageMaker JumpStart 可以视为 SageMaker 的一个扩展,它专注于简化机器学习项目的启动过程。通过提供预训练模型、解决方案模板和一键部署功能,JumpStart 大幅度降低了初始设置的复杂性,加快了从概念到实际应用的过渡。

在这里插入图片描述
JumpStart 的一键部署功能使用户能够迅速将模型投入实际应用,简化了复杂的技术步骤,使你能够更加专注于项目的核心目标。对于刚刚接触机器学习的新手,JumpStart 提供了详细的教程和学习资源,帮助你逐步掌握相关技术。即使是经验丰富的开发者,也能通过 JumpStart 提供的预配置和优化资源,进一步加速项目的开发进程。

在这里插入图片描述

1.2、Yi-1.5 9B Chat 模型

Yi-1.5 系列开源大模型是零一万物 Yi 系列模型的升级版,分为 6B、9B、34B 三个版本,采用 Apache 2.0 许可证。Yi-1.5 在前作的基础上使用高质量的 500B Token 进行持续预训练,因此延续了 Yi 系列开源模型的出色表现。

由下表可见,Yi-1.5 34B 在 C-Eval、CMMLU 和 Gaokao等多项基准测试中均超过了 GPT-3.5 和4,表明 Yi-1.5 34B 在处理汉语和与中国相关的任务时具有明显的优势。另外,Yi 系列经过微调的对话模型在 LMSYS Chatbot Arena 等主要评估平台上获得了较高的人类偏好率,能够提供自然流畅的对话交互体验和需求。

在这里插入图片描述
本次实验使用的是Yi-1.5 9B Chat 模型,它在多个任务上表现出色,尤其在对话生成、文本生成和语言理解方面尤为突出。Yi-1.5 9B Chat这个模型专门针对对话任务进行了优化,能够捕捉复杂的语言模式和上下文关系,从而生成更加自然和连贯的对话内容,在与用户交互时能产生相关且有意义的回应,理解上下文并提供连贯的回答。

二、Yi 1.5实践流程

2.1、准备SageMaker Studio环境

首先进入亚马逊云科技海外官网,点击进入亚马逊控制台,然后在左上方搜索栏搜索Amazon SageMaker,点击进入Amazon SageMaker界面
在这里插入图片描述
点击左侧导航栏中的 Domains,之后点击 Create domain,选择 Set up for single user (Quick setup),如果新建Studio环境失败的话,可以切换到US West (Oregon)(us-west-2)再试一试。如果提示没有用户的话,可以点击Add user 以添加新的用户,并在接下来的几个步骤中选择默认值,并点击 Next和Submit,等待片刻即可完成用户创建。

在这里插入图片描述
创建成功后点击创建好的Domain,随后切换到 用户配置文件 选项卡,看到预先创建好的用户,点击Launch中的Studio打开SageMaker Studio的环境。
在这里插入图片描述

显示如下页面,则说明成功创建并进入了SageMaker Studio工作区:

在这里插入图片描述

2.2、部署Yi-1.5-9B模型

进入SageMaker Studio后,点击左侧导航栏中的 JumpStart 按钮,然后在搜索栏中搜索 yi 来找到所有的 Yi 系列模型。
在这里插入图片描述
单击模型卡片会打开如下的模型详情页面,从该页面点击右上方的 Deploy ,快速进入模型的部署流程。

在这里插入图片描述
进入模型部署界面后,可以直接使用默认配置进行部署,也可以根据需要自定义部署设置,例如命名 SageMaker Endpoint、选择实例类型、设置初始实例数量和可扩展的最大实例数量等。以 Yi-1.5 9B Chat 为例,这里使用配备单个 A10g GPU 的 ml.g5.2xlarge 实例进行部署

在这里插入图片描述

触发部署后,可以在左侧 Endpoints 选项中,找到当前部署的 SageMaker Endpoint,并跟踪其部署状态,大概等待5分钟作用,Statue 转为 In Service 之后,表示模型部署成功。

在这里插入图片描述

2.3、运行推理Yi-1.5-9B模型

部署成功后,下面来运行推理Yi-1.5-9B模型,体验一下模型的效果。
点击左侧Endpoints,然后进入模型,选择Test inference页面,在Testing Options中选择Test the sample request进行测试,下放的JSON可以通过调整推理参数进行生成结果的控制:

在这里插入图片描述
输入想要对话的内容后,点击Send Request,得到对应的结果

在这里插入图片描述
当然还可以通过SageMaker Python SDK 对模型进行调用,指定部署完成的 SageMaker Endpoint 名称(如 jumpstart-dft-hf-llm-yi-1-5-9b-chat-20240607-033836),即可快速进行调用并获取推理结果。

以下代码通过 SageMaker 预测服务调用模型进行预测。首先,从 SageMaker 导入了 retrieve_default 函数来获取一个预测器实例。然后,通过指定的端点名称创建预测器。接着,准备了包含输入文本和预测参数的 payload。调用预测器的 predict 方法,将 payload 发送给模型以获取预测结果,最后打印出模型的回答。

from sagemaker.predictor import retrieve_default

# replace with your own endpoint name
endpoint_name = "jumpstart-dft-hf-llm-yi-1-5-9b-chat-20240607-033836"
predictor = retrieve_default(endpoint_name)
payload = {
    "inputs": "You are a helpful assistant.<|im_start|>user\nWho won the world series in 2020?<|im_end|>\n<|im_start|>assistant\n",
    "parameters": {
        "max_new_tokens": 256,
        "temperature": 0.2,
        "return_full_text": False
    }
}

# non streaming mode
response = predictor.predict(payload)
print(response)

三、体验总结

通过实验,可以看到,Amazon SageMaker JumpStart 提供了一种高效的方法来访问和利用这些强大的模型。借助 Amazon SageMaker JumpStart 可以很轻松的访问 Yi-1.5 6B,9B 和 34B 的 Base 和 Chat 优化的 6 个基础模型,除此之外,还可以访问来自 Meta、AI21Labs 和 HuggingFace 等公司的先进模型。无论是构建对话系统还是处理复杂的文本任务,Yi 1.5 模型都能提供强大的支持。

在这里插入图片描述
现在注册亚马逊云科技海外账号,立即就可以免费使用这些便捷服务。作为新注册的用户,除了免费的Amazon SageMaker,还有丰富的亚马逊云服务器(Amazon EC2)、亚马逊云科技云存储(Amazon S3),负载均衡(Elastic Load Balancing),虚拟服务器VPS(Amazon Lightsail)、视频会议(Amazon Chime )等等100 余种云产品或服务免费试用。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2056455.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

YOLOv8轻量化改进之slimneck

目录 一、原理 二、代码 三、修改到YOLOv8中 四、yaml文件修改 一、原理 论文地址:2206.02424 (arxiv.org) 主要模块的网络结构 二、代码 slimneck的代码如下,slimneck主要由GSConv和VoVGSCSPC两部分组成。 class GSConv(nn.Module):# GSConv https://github.com/Alan…

分布式高可用架构设计

一、限流 1、单机限流 如图&#xff0c;应用C的资源c/x被上游的应用A和应用C并发访问&#xff0c;应用C的系统能力支持c/x资源最高5000/qps的访问量&#xff1b;为了不让高并发流量或尖峰流量压垮应用C&#xff0c;可以针对应用C的资源c/x做限流&#xff1b;比如设置限流4500…

为什么会有浮毛猫毛?这些不容忽视的危害宠物空气净化器能解决!

很多人看到朋友家可爱的猫猫狗狗&#xff0c;自己也心痒痒想要养一只。但一想到宠物可能会带来的掉毛、体臭等问题&#xff0c;又犹豫不决。诚然&#xff0c;养宠物确实会对室内空气造成一定影响&#xff0c;但养宠人的共识是&#xff1a;那份与宠物共度的快乐时光&#xff0c;…

mysql索引探索

《令人困惑的mysql索引》在这篇文章中&#xff0c;遗留了几个困惑。为了解决这些困惑&#xff0c;我又进行了一些测试。 本文中索引的建立&#xff0c;并不一定科学&#xff0c;查询的SQL也不一定科学&#xff0c;只是为了理解mysql索引建的一些测试数据。 CREATE TABLE cms_…

加密与安全_双向RSA+AES加密及Code实现

文章目录 AES / RSA流程Code生成AES密钥 和 生成RSA密钥对AES工具类&#xff0c;提供AES加密和解密功能RSA加密工具类测试类 总结 AES / RSA AES&#xff1a;一种对称加密算法&#xff0c;意味着加密和解密使用相同的密钥。速度快&#xff0c;适合加密大量数据。RSA&#xff1…

Tina-Linux Bootloaer简述

Tina-Linux Bootloaer简述 目录介绍 ubuntuubuntu1804:~/tina-v2.0-sdk/lichee/brandy-2.0$ tree -L 1 . ├── build.sh ├── opensbi ├── spl //boot0 ├── spl-pub //boot0 ├── tools └── u-boot-2018 /ubootTina-Linux 启动流程简述

ant design pro v6 如何做好角色管理

先上图&#xff1a; 整个角色管理是如何做的吗&#xff1f; 首先你要处理后端&#xff0c;要先把角色存到用户那。 这是用户管理部分的内容&#xff1a; 可以看到一个用户是有多个角色的。 看到没有&#xff0c;存的是数组 数组的是一个 role 对象 role 对象是这样&#xf…

reactive 和 ref 的区别和联系

在 Vue3 的组合式 API &#xff08;Composition API&#xff09;中&#xff0c;ref 和 reactive 是用于创建响应式数据的两个核心函数。尽管二者都用于实现响应式数据&#xff0c;但在使用方式和适用场景上存在一些区别。 1. 基本概念 1.1 ref 用途&#xff1a;用于定义 基本…

深入探讨视频美颜SDK:直播美颜工具的核心技术与实现

本篇文章&#xff0c;笔者将深入探讨视频美颜SDK的核心技术及其在直播美颜工具中的实现。 一、视频美颜SDK的核心技术 视频美颜SDK通过一系列复杂的算法和技术&#xff0c;实时处理视频流并应用各种美颜效果。这些核心技术主要包括以下几个方面&#xff1a; 1.人脸识别与追踪…

【Hot100】LeetCode—24. 两两交换链表中的节点

目录 1- 思路四指针 2- 实现⭐24. 两两交换链表中的节点——题解思路 3- ACM 实现 原题连接&#xff1a;24. 两两交换链表中的节点 1- 思路 四指针 定义 dummyHead&#xff1a;便于处理头结点① cur 指针&#xff0c;记录两个交换节点的前 前一个结点② 第一个指针 first③ 第…

嵌入式开发--STM32G030C8T6,写片上FLASH死机CFGBSY和写入出错

故障现象1 G0系列&#xff0c;写片上FLASH时&#xff0c;经常死机&#xff0c;而且按复位键都没用&#xff0c;属于不断电都救不回来的那种死法。这种情况一般是由硬件置位了某个标志导致&#xff0c;只有断电才能故障复原。 故障查找 检查FLASH的相关寄存器&#xff0c;发现…

【秋招笔试】8.18大疆秋招(第一套)-后端岗

🍭 大家好这里是 春秋招笔试突围,一起备战大厂笔试 💻 ACM金牌团队🏅️ | 多次AK大厂笔试 | 编程一对一辅导 ✨ 本系列打算持续跟新 春秋招笔试题 👏 感谢大家的订阅➕ 和 喜欢💗 和 手里的小花花🌸 ✨ 笔试合集传送们 -> 🧷春秋招笔试合集 🍒 本专栏已收…

树莓派Pico C/C++ 开发环境搭建(一键完成版)

树莓派Pico C/C 开发环境搭建(一键完成版) 因为之前使用过MicroPython开发过树莓派Pico&#xff0c;总觉得用起来怪怪的。正好最近树莓怕发布了新一代的MCU——RP2350&#xff0c;之前的RP2040在各个平台都有所降价&#xff0c;因此&#xff0c;买了几块。同时因为之前是玩stm…

【系统架构设计】系统分析与设计方法

【系统架构设计】系统分析与设计方法 定义问题与归结模型问题分析因果鱼骨图 帕累托图上下文范围图 问题定义 需求分析与软件设计结构化分析与设计结构化分析DFD数据字典技术 结构化设计结构图程序流程图和盒图 模块设计 面向对象的分析与设计用户界面设计 定义问题与归结模型…

Eureka 原理与实践全攻略

一、Eureka 概述 Eureka 在微服务架构中具有举足轻重的地位。它作为服务注册与发现的核心组件&#xff0c;为分布式系统中的服务管理提供了关键支持。 Eureka 的主要功能包括服务注册、服务发现、服务健康监测和自我保护机制。服务注册功能使得服务提供者能够在启动时将自身的…

Linux安装配置docker,k8s

1.linux虚拟机初始配置 详情操作见下&#xff0c;具体操作需要注意 1.网络模式选择 NAT模式&#xff08;对应第8点&#xff09; 2.不用选择安装 GUI图形界面 (对应19点-5) 3.分区非必须操作 可以不分区(对应20点) 4.打开网络开关 (对应23点) CentOS 7安装教程&#xff…

利用GPTs,打造你的专属AI聊天机器人

在2023年11月的「OpenAI Devday」大会上&#xff0c;OpenAI再度带来了一系列令人瞩目的新功能&#xff0c;其中ChatGPT方面的突破尤为引人关注。而GPTs的亮相&#xff0c;不仅标志着个性化AI时代的到来&#xff0c;更为开发者和普通用户提供了前所未有的便利。接下来&#xff0…

C语言-部分字符串函数详解 1-4

C语言-部分字符串函数详解 1-4 前言1.strlen1.1基本用法1.2注意事项\0size_t 1.3模拟实现 2.strcpy2.1基本用法2.2注意事项**源字符串必须以 \0 结束****会将源字符串中的 \0拷贝到目标空间****目标空间必须可修改****目标空间必须能容纳下源字符串的内容** 2.3模拟实现 3.strn…

ES 模糊查询 wildcard 的替代方案探索

一、Wildcard 概述 Wildcard 是一种支持通配符的模糊检索方式。在 Elasticsearch 中&#xff0c;它使用星号 * 代表零个或多个字符&#xff0c;问号 ? 代表单个字符。 其使用方式多样&#xff0c;例如可以通过 {"wildcard": {"field_name": "value&…

【数据结构】关于冒泡排序,选择排序,插入排序,希尔排序,堆排序你到底了解多少???(超详解)

前言&#xff1a; &#x1f31f;&#x1f31f;Hello家人们&#xff0c;这期讲解排序算法的原理&#xff0c;希望你能帮到屏幕前的你。 &#x1f308;上期博客在这里&#xff1a;http://t.csdnimg.cn/I1Ssq &#x1f308;感兴趣的小伙伴看一看小编主页&#xff1a;GGBondlctrl-C…