DeepSeek-R1 模型现已在亚马逊云科技上提供

news2025/4/2 23:25:13

2025年3月10日更新—DeepSeek-R1现已作为完全托管的无服务器模型在Amazon Bedrock上提供。

2025年2月5日更新—DeepSeek-R1 Distill Llama 和 Qwen模型现已在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart中提供。

在最近的Amazon re:Invent大会上,亚马逊 CEO安迪·贾西分享了公司在开发近1000个生成式 AI 应用程序过程中获得的重要经验。基于这一大规模 AI 部署的实践,贾西提出了三个关键观察,这些观察塑造了亚马逊在企业 AI 实施方面的策略。

首先,随着生成式 AI 应用程序的规模扩大,计算成本变得至关重要。人们对更高的性价比有着极大的需求。其次,构建一个真正出色的生成式 AI 应用程序其实非常困难。第三,当我们让开发者自由选择他们想要使用的工具时,模型的多样性就显现出来。这一点并不让我们感到意外,因为我们一再吸取同样的教训:永远不会有一个工具能够统治整个 AI 领域。

正如安迪所强调的,亚马逊提供的广泛而深入的模型系列使客户能够选择最适合其独特需求的精准能力。通过密切关注客户需求和技术发展,亚马逊云科技定期扩展我们精选的模型库,既包括成熟行业宠儿,也囊括前景广阔的新兴模型。这种高性能和差异化模型产品的持续扩展,帮助客户保持在 AI 创新最前沿。

这让我们将目光转向中国的 AI 初创公司深度求索(DeepSeek)。深度求索于 2024 年 12 月发布了 DeepSeek-V3,随后在 2025 年 1 月 20 日推出了DeepSeek-R1、拥有 6710 亿参数的 DeepSeek-R1-Zero,以及参数范围在15亿至 700 亿之间的DeepSeek-R1-Distill模型。2025年1月 27日,他们又增加了基于视觉的Janus-Pro-7B模型。这些模型均公开可用,据报道,其性价比比同类模型高出90%至95%。据深度求索表示,其模型因其推理能力而脱颖而出,这得益于通过强化学习等创新训练方法实现的突破。

如今,您可以在AmazonBedrock和Amazon SageMaker AI中部署 DeepSeek-R1 模型。Amazon Bedrock最适合希望通过API快速集成预训练基础模型的团队。Amazon SageMaker AI则非常适合希望进行高级定制、训练和部署,并能够访问底层基础设施的组织。此外,您还可以使用Amazon Trainium和AmazonInferentia,通过Amazon Elastic Compute Cloud(Amazon EC2或Amazon SageMaker AI经济高效地部署DeepSeek-R1-Distill模型。

通过 亚马逊云科技,您可以使用DeepSeek-R1模型以最小的基础设施投资构建、试验并负责任地扩展生成式 AI 项目,得益于其强大的成本效益。您还可以基于 亚马逊云科技专为安全设计的服务,自信地推动生成式AI创新。我们强烈建议将DeepSeek-R1模型的部署与Amazon Bedrock Guardrails集成,为您的生成式AI应用程序增加一层保护,该功能可供Amazon Bedrock和Amazon SageMaker AI客户共同使用。

现在,您可以通过以下几种方式在 亚马逊云科技 上部署DeepSeek-R1模型:  
1. 通过Amazon Bedrock Marketplace获取DeepSeek-R1模型,  
2. 通过Amazon SageMaker JumpStart获取DeepSeek-R1模型,  
3. 通过Amazon Bedrock自定义模型导入功能获取DeepSeek-R1-Distill模型,  
4. 通过Amazon EC2 Trn1实例获取DeepSeek-R1-Distill模型。  

让我为您详细介绍在 亚马逊云科技上开始使用DeepSeek-R1模型的各种路径。无论您是构建首个 AI 应用程序还是扩展现有解决方案,这些方法都可以根据团队的技能和需求提供灵活的起点。

1. Amazon Bedrock Marketplace中的DeepSeek-R1模型
Amazon Bedrock Marketplace提供了超过 100 个流行、新兴和专业的基础模型(FMs),同时与当前行业领先的模型一起供选择。您可以轻松地在单一目录中发现模型,订阅模型,然后在托管的端点上部署模型。  

要访问Amazon Bedrock Marketplace中的DeepSeek-R1模型,请进入Amazon Bedrock控制台,在“基础模型”部分选择“模型目录”。您可以通过搜索或按模型提供商筛选快速找到DeepSeek模型。

 在查看模型详细信息页面(包括模型的功能和实施指南)后,您可以直接部署模型,只需提供端点名称、选择实例数量并选择实例类型即可。

您还可以配置高级选项,以自定义DeepSeek-R1模型的安全性和基础设施设置,包括VPC网络、服务角色权限和加密设置。对于生产部署,您应审查这些设置,以确保其符合您组织的安全性和合规性要求。

通过Amazon Bedrock Guardrails,您可以独立评估用户输入和模型输出。您可以通过生成式AI应用程序中过滤不良和有害内容,根据自定义的策略集控制用户与DeepSeek-R1之间的交互。Amazon Bedrock Marketplace中的DeepSeek-R1模型只能与Bedrock的ApplyGuardrail API结合使用,以评估用户输入和模型响应,适用于Amazon Bedrock之外的自定义和第三方基础模型(FMs)。了解更多信息,请阅读[使用 Amazon Bedrock Guardrails 实施模型无关的安全措施](https://Amazon.amazon.com/cn/blogs/machine-learning/implement-model-independent-safety-measures-with-amazon-bedrock-guardrails/)。

Amazon Bedrock Guardrails还可以与其他Bedrock工具集成,包括Amazon Bedrock Agents和 Amazon Bedrock Knowledge Bases,以构建更安全、更符合负责任AI政策的生成式AI应用程序。了解更多信息,请访问[亚马逊云科技负责任AI页面](https://Amazon.amazon.com/cn/machine-learning/responsible-ai/)。

2025年2月1日更新 — 您可以使用Bedrock的Playground功能,了解模型对各种输入的响应方式,并优化提示词以获取最佳结果。

在使用DeepSeek-R1模型与Bedrock的Playground或InvokeModel API时,请使用DeepSeek的聊天模板以获得最佳效果。例如:

<|begin_of_sentence|><|User|>content for inference<|Assistant|>.

2. Amazon SageMaker JumpStart中的DeepSeek-R1模型  
Amazon SageMaker JumpStart是一个机器学习(ML)中心,提供基础模型(FMs)、内置算法和预构建的ML 解决方案,只需点击几下即可部署。要在SageMaker JumpStart中部署DeepSeek-R1模型,您可以在SageMaker Unified Studio、SageMaker Studio或SageMaker AI控制台中发现该模型,或通过SageMaker Python SDK以编程方式查找。

在Amazon SageMaker AI控制台中,打开SageMaker Studio,选择JumpStart,然后在“所有公共模型”页面中搜索“DeepSeek-R1”。

 选择模型后,点击“部署”即可使用默认设置创建端点。当端点状态变为“InService”(服务中)时,您可以通过向其端点发送请求来进行推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2326839.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python数据可视化-第2章-使用matplotlib绘制简单图表

环境 开发工具 VSCode库的版本 numpy1.26.4 matplotlib3.10.1 ipympl0.9.7教材 本书为《Python数据可视化》一书的配套内容&#xff0c;本章为第2章 使用matplotlib绘制简单图表 本文主要介绍了折线图、柱形图或堆积柱形图、条形图或堆积条形图、堆积面积图、直方图、饼图或…

Redis 02

今天是2025/04/01 20:13 day 16 总路线请移步主页Java大纲相关文章 今天进行Redis 3,4,5 个模块的归纳 首先是Redis的相关内容概括的思维导图 3. 持久化机制&#xff08;深度解析&#xff09; 3.1 RDB&#xff08;快照&#xff09; 核心机制&#xff1a; 触发条件&#xff…

unity UI管理器

using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.Events;// UI界面基类 public abstract class UIBase : MonoBehaviour {[Header("UI Settings")]public bool keepInStack true; // 是否保留在界面栈中public …

STRUCTBERT:将语言结构融入预训练以提升深度语言理解

【摘要】最近&#xff0c;预训练语言模型BERT&#xff08;及其经过稳健优化的版本RoBERTa&#xff09;在自然语言理解&#xff08;NLU&#xff09;领域引起了广泛关注&#xff0c;并在情感分类、自然语言推理、语义文本相似度和问答等各种NLU任务中达到了最先进的准确率。受到E…

16-CSS3新增选择器

知识目标 掌握属性选择器的使用掌握关系选择器的使用掌握结构化伪类选择器的使用掌握伪元素选择器的使用 如何减少文档内class属性和id属性的定义&#xff0c;使文档变得更加简洁&#xff1f; 可以通过属性选择器、关系选择器、结构化伪类选择器、伪元素选择器。 1. 属性选择…

SQL Server:用户权限

目录 创建 & 删除1. 创建用户命令整理创建 admin2 用户创建 admin_super 用户 2. 删除用户命令删除 admin2 用户删除 admin_super 用户 3. 创建时权限的区别admin2 用户权限admin_super 用户权限 查看方法一&#xff1a;使用对象资源管理器&#xff08;图形化界面&#xff…

服务器数据恢复—误格式化NTFS文件系统分区别慌,NTFS数据复活秘籍

NTFS文件系统下格式化在理论上不会对数据造成太大影响&#xff0c;但有可能造成部分文件目录结构丢失的情况。下面介绍一个人为误操作导致服务器磁盘阵列中的NTFS文件系统分区被格式化后的服务器数据恢复案例。 服务器数据恢复过程&#xff1a; 1、将故障服务器连接到一台备份…

【3】数据结构的双向链表章

目录标题 双向链表的定义双向链表的初始化双向链表的创建插入操作删除操作 双向链表总代码与调试 双向链表的定义 结点结构组成&#xff1a;数据域&#xff08;data&#xff09;、指针域&#xff08;pre&#xff09;、指针域&#xff08;next&#xff09;。其中&#xff0c; da…

蓝桥杯杯赛-日期模拟

知识点 处理日期 1. 按天枚举日期&#xff1a;逐天遍历起始日期到结束日期范围内的每个日期。 2. 处理闰年&#xff1a;正确判断闰年条件。闰年定义为&#xff1a;年份 满足以下任意一个条件&#xff1a;(闰年的2月只有29天) 满足下面一个条件就是闰年 1> 是 400 的倍数…

搭建开源笔记平台:outline

折腾的意义 为什么要自己搭建一个笔记平台&#xff1f;没理由&#xff0c;就是突然想试试。有时候突然有个想法&#xff0c;搜了一下正好有合适的方案&#xff0c;就顺手试一下。 其实已经有很多成熟的笔记软件&#xff0c;例如Notion/OneNote&#xff0c;但谁不想要一个数据完…

Unity编辑器功能及拓展(2) —Gizmos编辑器绘制功能

Unity中的Gizmos功能是用于在场景视图中绘制辅助图形或图标的工具&#xff0c;帮助开发者在编辑模式下直观调试和可视化游戏对象的位置、范围、方向等信息。 一.定义概述 Gizomsd 概述 Gizoms是Unity提供的一个API&#xff0c;或者叫做一个工具类&#xff0c;包含一系列静态…

电脑屏幕亮度随心控,在Windows上自由调整屏幕亮度的方法

调整电脑屏幕的亮度对于保护视力和适应不同环境光线条件非常重要。无论是在白天强光下还是夜晚昏暗环境中&#xff0c;合适的屏幕亮度都能让您的眼睛更加舒适。本文中简鹿办公小编将向您介绍几种在 Windows 系统中调整屏幕亮度的方法。 方法一&#xff1a;使用快捷键 大多数笔…

presto行转列

presto的行列转换和spark、hive一样也是通过外链语句实现的&#xff0c;只不过语法和关键子有点不同&#xff0c;如下 with tmp1 as (select 1,2,3 as a1,4,5,6 as a2 ) select * from tmp1 cross join unnest(split(tmp1.a1, ,),split(tmp1.a2, ,) ) as b(a1s,a2s) 结果如下

51c自动驾驶~合集15

我自己的原文哦~ https://blog.51cto.com/whaosoft/11720657 #DRAMA 首个基于Mamba的端到端运动规划器&#xff08;新加坡国立&#xff09; 运动规划是一项具有挑战性的任务&#xff0c;在高度动态和复杂的环境中生成安全可行的轨迹&#xff0c;形成自动驾驶汽车的核心能…

拼多多 anti-token unidbg 分析

声明: 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 逆向分析 版本7.3-7.4 都试过加密没什…

【Git】5 个分区的切换方式及示例

目录 1. **工作区&#xff08;Working Directory&#xff09;**2. **缓存区&#xff08;Stage/Index&#xff09;**3. **本地仓库&#xff08;Local Repository&#xff09;**4. **远程仓库&#xff08;Remote Repository&#xff09;**5. **贮藏区&#xff08;Stash&#xff0…

Java高频面试之并发编程-02

hello啊&#xff0c;各位观众姥爷们&#xff01;&#xff01;&#xff01;本baby今天来报道了&#xff01;哈哈哈哈哈嗝&#x1f436; 面试官&#xff1a;进程和线程的区别是什么&#xff1f; 1. 资源分配与独立性 进程&#xff1a; 独立性&#xff1a;每个进程拥有独立的内存…

openwebui和keycloak集成,使用keycloak的用户名和密码登录

1&#xff0c;实现效果 使用keycloak定义的用户名和密码&#xff0c;直接登录openwebui 2&#xff0c;实现原理 keycloak中用户信息中包含用户名和密码&#xff0c;以及email。 使用keycloak中的用户名和密码登录之后&#xff0c;会用email创建一个openwebui的账号。之后每次…

【区块链安全 | 第八篇】多签机制及恶意多签

部分参考&#xff1a;慢雾科技 文章目录 为什么需要多签多签机制Tron钱包下的恶意多签Tron 钱包多签权限分类Tron 多签机制的运作方式 恶意多签的过程黑客通过多签机制控制账户黑客剥夺用户权限&#xff0c;完全控制账户 恶意多签成因 在区块链中&#xff0c;多签&#xff08;M…

二月公开赛Web-ssrfme

目录 环境搭建 题目分析 分析代码 解题过程 Redis未授权访问 寻找Flag 环境搭建 进入含有docker-compose.yml的文件内&#xff0c;拉取容器镜像 docker-compose up -d 题目分析 访问容器地址172.25.254.200:8091查看题目 分析代码 url通过GET请求访问界面&#xff0c…