亚马逊云科技全面托管DeepSeek-R1模型现已上线

news2025/3/31 13:20:01

文章目录

      • 亚马逊云科技全面托管DeepSeek-R1模型现已上线
      • 在Amazon Bedrock中开始使用DeepSeek-R1模型
      • DeepSeek-R1现已可用

亚马逊云科技全面托管DeepSeek-R1模型现已上线

亚马逊云科技提供众多免费云产品,可以访问:亚马逊云科技

截至1月30日,DeepSeek-R1模型通过Amazon Bedrock Marketplace和Amazon Bedrock Custom Model Import在Amazon Bedrock中正式可用。此后,数千名客户已在Amazon Bedrock中部署了这些模型。客户们非常看重其强大的防护措施和全面的工具支持,以确保AI的安全部署。今天,我们通过扩展选项范围,包括全新的无服务器解决方案,进一步简化了在Amazon Bedrock中使用DeepSeek的流程。

完全托管的DeepSeek-R1模型现已在Amazon Bedrock中全面可用。亚马逊网络服务(亚马逊云科技)是首家以完全托管形式提供DeepSeek-R1模型的云服务提供商(CSP)。可以在亚马逊云科技上使用DeepSeek加速创新并交付切实的商业价值,而无需管理基础设施的复杂性。通过Amazon Bedrock的完全托管服务,只需使用单个API即可为生成式AI应用程序提供DeepSeek-R1的功能支持,并享受其丰富的功能和工具带来的优势。

根据DeepSeek的说法,他们的模型在MIT许可下公开可用,具备强大的推理、编码和自然语言理解能力。这些能力支持智能决策、软件开发、数学问题解决、科学分析、数据洞察以及全面的知识管理系统。

与所有AI解决方案一样,在生产环境中实施时需谨慎考虑数据隐私要求,检查输出中的偏差,并监控结果。在实施像DeepSeek-R1这样的公开模型时,请考虑以下几点:

数据安全 – 可以利用Amazon Bedrock的企业级安全、监控和成本控制功能,这些功能对于负责任地大规模部署AI至关重要,同时可以完全掌控数据。用户的输入和模型输出不会与任何模型提供商共享。可以默认使用这些关键安全功能,包括静态和传输中的数据加密、细粒度访问控制、安全连接选项,并在与Amazon Bedrock中的DeepSeek-R1模型通信时下载各种合规性认证。

负责任的AI – 可以通过Amazon Bedrock Guardrails根据应用需求和负责任的AI政策实施定制的防护措施。这包括内容过滤、敏感信息过滤以及可定制的安全控制等关键功能,通过上下文 grounding 和自动化推理检查防止幻觉(hallucination)。这意味着可以通过定义的政策集控制用户与Bedrock中DeepSeek-R1模型的交互,过滤掉不受欢迎和有害的内容。

模型评估 – 可以通过Amazon Bedrock model evaluation tools在几步之内评估和比较模型,以确定适合用例的最佳模型(包括DeepSeek-R1)。可以选择使用预定义指标(如准确性、鲁棒性和毒性)进行自动评估,或者选择基于主观或自定义指标(如相关性、风格和品牌声音一致性)的人工评估流程。模型评估提供内置的精选数据集,也可以引入自己的数据集。

我们强烈推荐将Amazon Bedrock Guardrails和Amazon Bedrock model evaluation features与DeepSeek-R1模型集成,以为生成式AI应用程序提供强大的保护。欲了解更多信息,请访问Protect your DeepSeek model deployments with Amazon Bedrock Guardrails和Evaluate the performance of Amazon Bedrock resources。

亚马逊云科技的免费云产品,助您零成本开启云计算之旅,探索无限可能!

在Amazon Bedrock中开始使用DeepSeek-R1模型

如果是DeepSeek-R1模型的新用户,请前往Amazon Bedrock console,在左侧导航栏中选择“Bedrock configurations”下的“Model access”。要访问完全托管的DeepSeek-R1模型,请在DeepSeek中为DeepSeek-R1请求访问权限。随后,将在Amazon Bedrock中获得对该模型的访问权限。

  1. 访问DeepSeek-R1模型

接下来,要在Amazon Bedrock中测试DeepSeek-R1模型,请在左侧菜单栏中选择“Playgrounds”下的“Chat/Text”。然后在左上角选择“Select model”,选择“DeepSeek”作为类别,“DeepSeek-R1”作为模型,然后点击“Apply”。

  1. 选择DeepSeek-R1模型

使用选定的DeepSeek-R1模型,我运行了以下提示示例:

一个家庭有5000美元用于明年度假的储蓄。他们可以将钱存入年利率2%的储蓄账户,或者存入年利率4%的定期存款,但在这之前无法动用资金。如果他们在一年中需要1000美元的紧急支出,他们应如何在两种选择之间分配资金,以最大化他们的度假基金?

这个提示需要复杂的思维链,并产生非常精确的推理结果。

  1. 在Chat Playground中测试DeepSeek-R1

要了解更多关于提示使用建议的信息,请参阅DeepSeek-R1 model prompt guide。

通过选择“View API request”,还可以使用Amazon Command Line Interface (Amazon CLI)和Amazon SDK中的代码示例访问模型。可以使用“us.deepseek.r1-v1:0”作为模型ID。

以下是Amazon CLI命令示例:

aws bedrock-runtime invoke-model \
       --model-id us.deepseek.r1-v1:0 \
       --body "{\"prompt\": \"<|begin_of_sentence|><|User|>Type_Your_Prompt_Here<|Assistant|><think>\n\", \"max_tokens\": 512, \"temperature\": 0.5, \"top_p\": 0.9}" \
       --cli-binary-format raw-in-base64-out \
       --region us-west-2 \
       invoke-model-output.txt

该模型同时支持InvokeModel和Converse API。以下Python代码示例展示了如何使用Amazon Bedrock Converse API向DeepSeek-R1模型发送文本消息以进行文本生成。欲了解更多信息,请访问DeepSeek model inference parameters and responses。

import boto3
from botocore.exceptions import ClientError

# 在想使用的亚马逊云科技区域创建一个Bedrock Runtime客户端。
client = boto3.client("bedrock-runtime", region_name="us-west-2")

# 设置模型ID,例如DeepSeek-R1模型。
model_id = "us.deepseek.r1-v1:0"

# 开始与用户消息的对话。
user_message = "Type_Your_Prompt_Here"
conversation = [
    {
        "role": "user",
        "content": [{"text": user_message}],
    }
]

try:
    # 使用基本推理配置将消息发送到模型。
    response = client.converse(
        modelId=model_id,
        messages=conversation,
        inferenceConfig={"maxTokens": 512, "temperature": 0.5, "topP": 0.9},
    )

    # 提取并打印响应文本。
    response_text = response["output"]["message"]["content"][0]["text"]
    print(response_text)

except (ClientError, Exception) as e:
    print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}")
    exit(1)

要为DeepSeek-R1模型启用Amazon Bedrock Guardrails,在左侧导航栏中选择“Safeguards”下的“Guardrails”,通过配置所需数量的过滤器创建防护栏。例如,如果过滤“politics”这个词,防护栏将识别提示中的这个词并显示被阻止的消息。

可以使用不同的输入测试防护栏,以评估其性能。可以通过设置禁止主题、词语过滤器、敏感信息过滤器和阻止消息来调整防护栏,直到满足需求。

要了解更多关于Amazon Bedrock Guardrails的信息,请访问Stop harmful content in models using Amazon Bedrock Guardrails或亚马逊云科技机器学习博客频道上关于Amazon Bedrock Guardrails的其他深入博客文章。

以下是展示如何利用Amazon Bedrock中完全托管的DeepSeek-R1模型的演示演练:

DeepSeek-R1现已可用

DeepSeek-R1现已在Amazon Bedrock中以完全托管形式提供,支持美国东部(弗吉尼亚北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)亚马逊云科技区域,通过跨区域推理提供服务。请查看完整的区域列表以获取未来更新。欲了解更多信息,请查看DeepSeek in Amazon Bedrock product page和Amazon Bedrock pricing page。

立即在Amazon Bedrock console中试用DeepSeek-R1模型,并通过Amazon re:Post for Amazon Bedrock或常用的亚马逊云科技支持联系方式发送反馈。

— Channy

2025年3月10日更新 — 修复了模型选择和模型ID的截图。

2025年3月13日更新 — 添加了DeepSeek-R1 model prompt guide和DeepSeek model inference parameters and responses的指南链接。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2323414.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2025年移动端开发性能优化实践与趋势分析

启动速度优化 本质&#xff1a;缩短首次可见帧渲染时间。 方法&#xff1a; iOS&#xff1a;利用Core ML本地模型轻量化部署&#xff0c;减少云端等待。Android&#xff1a;强制启用SplashScreen API&#xff0c;通过setKeepOnScreenCondition控制动画时长。冷启动需将耗时操…

Docker Compose介绍

基本概念 Docker-Compose是Docker官方的开源项目&#xff0c;负责实现对docker容器集群的快速编排。 可以这么理解&#xff0c;docker compose是docker提出的一个工具软件&#xff0c;可以管理多个docker容器组成一个应用&#xff0c;只需要编写一个YAML格式的配置文件docker…

头歌实践教学平台--【数据库概论】--SQL

一、表结构与完整性约束的修改(ALTER) 1.修改表名 USE TestDb1; alter table your_table rename TO my_table; 2.添加与删除字段 #语句1&#xff1a;删除表orderDetail中的列orderDate alter table orderDetail drop orderDate; #语句2&#xff1a;添加列unitPrice alter t…

算法基础——模拟

目录 1 多项式输出 2.蛇形方阵 3.字符串的展开 模拟&#xff0c;顾名思义&#xff0c;就是题⽬让你做什么你就做什么&#xff0c;考察的是将思路转化成代码的代码能⼒。这类题⼀般较为简单&#xff0c;属于竞赛⾥⾯的签到题&#xff08;但是&#xff0c;万事⽆绝对&#xff…

【第30节】MFC编程:ListCtrl控件和TreeCtrl控件

目录 引言 一、高级控件ListCtrl 二、高级控件TreeCtrl 三、Shell控件 四、CImageList 五、综合代码示例 引言 在MFC编程里&#xff0c;高级控件能大幅提升应用程序的交互性与功能性。接下来&#xff0c;咱们会详细讲讲ListCtrl和TreeCtrl这两个高级控件。不仅会介绍它们…

JavaScript 手写 call、apply、bind 和 new

1. 手写 call 方法 核心思路&#xff1a;改变函数的 this 指向并立即执行&#xff0c;通过将函数临时挂载到目标对象上调用。 Function.prototype.myCall function (context, ...args) {// 如果 context 为 null 或 undefined&#xff0c;则默认为 windowcontext context |…

计算机网络基础:量子通信技术在网络中的应用前景

计算机网络基础:量子通信技术在网络中的应用前景 一、前言二、量子通信技术基础2.1 量子通信的基本概念2.2 量子通信的主要原理2.2.1 量子密钥分发(QKD)原理2.2.2 量子隐形传态原理三、量子通信技术的特点3.1 绝对安全性3.2 超高通信速率潜力3.3 抗干扰能力强四、量子通信技…

Postman 下载文件指南:如何请求 Excel/PDF 文件?

在 Postman 中进行 Excel/PDF 文件的请求下载和导出&#xff0c;以下是简明的步骤&#xff0c;帮助你轻松完成任务。首先&#xff0c;我们将从新建接口开始&#xff0c;逐步引导你完成整个过程。 Postman 请求下载/导出 excel/pdf 文件教程

Stereolabs ZED Box Mini:机器人与自动化领域的人工智能视觉新选择

在人工智能视觉技术快速发展的今天&#xff0c;其应用场景正在持续拓宽&#xff0c;从智能安防到工业自动化&#xff0c;从机器人技术到智能交通&#xff0c;各领域都在积极探索如何利用这一先进技术。而 Stereolabs 推出的ZED Box Mini&#xff0c;正是一款专为满足这些多样化…

arm之s3c2440的I2C的用法

基础概念 IC&#xff08;Inter-Integrated Circuit&#xff09;又称I2C&#xff0c;是是IICBus简称&#xff0c;所以中文应该叫集成电路总线。 IIC的总线的使用场景&#xff0c;所有挂载在IIC总线上的设备都有两根信号线&#xff0c;一根是数据线SDA&#xff0c;另一 根是时钟…

redis部署架构

一.redis多实例 如上图所示&#xff0c;我们经常使用实例的端口号来作为实例的安装目录名称。 1.创建实例安装目录 如上图所示&#xff0c;这是创建实例的安装目录&#xff0c; 2.拷贝实例的配置文件 如上图所示&#xff0c;将redis解压目录下的配置文件拷贝到对应的conf目录…

深入理解指针(4)(C语言版)

文章目录 前言一、回调函数是什么&#xff08;一&#xff09;定义&#xff08;二&#xff09;工作原理&#xff08;三&#xff09;应用场景 二、qsort举例&#xff08;一&#xff09;qsort函数简介&#xff08;二&#xff09;比较函数的定义&#xff08;三&#xff09;使用示例…

【HTML】验证与调试工具

个人主页&#xff1a;Guiat 归属专栏&#xff1a;HTML CSS JavaScript 文章目录 1. HTML 验证工具概述1.1 验证的重要性1.2 常见 HTML 错误类型 2. W3C 验证服务2.1 W3C Markup Validation Service2.2 使用 W3C 验证器2.3 验证结果解读 3. 浏览器开发者工具3.1 Chrome DevTools…

​​SenseGlove与Aeon Robotics携手推出HEART项目,助力机器人培训迈向新台阶

在自动化和机器人技术快速发展的今天&#xff0c;SenseGlove和Aeon Robotics联合推出了一项创新项目——HEART项目。该项目在欧盟资助的MasterXR框架内展开&#xff0c;旨在通过整合虚拟现实&#xff08;VR&#xff09;、力反馈触觉手套&#xff08;SenseGlove项目Rembrandt&am…

mapbox进阶,仿照百度,加载marker点位,移入marker点切换图标,点击展示气泡,气泡和marker联动

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.2 ☘️mapboxgl.Map style属性1.3 ☘️marker 标注点位 api1.3.1 ☘️构造函数…

使用HTML5和CSS3实现3D旋转相册效果

使用HTML5和CSS3实现3D旋转相册效果 这里写目录标题 使用HTML5和CSS3实现3D旋转相册效果项目介绍技术栈核心功能实现思路1. HTML结构2. CSS样式解析2.1 基础样式设置2.2 3D效果核心样式2.3 卡片样式 3. JavaScript交互实现3.1 旋转控制3.2 自动播放功能 技术要点总结项目亮点总…

游戏引擎学习第186天

回顾并规划今天的任务 现在&#xff0c;我们站在了一个关键的时刻&#xff0c;准备突破&#xff0c;拥有一些优秀的性能分析代码。从目前来看&#xff0c;我们已经能够看到时间的消耗情况&#xff0c;我对这一点感到非常兴奋。昨天的直播中我们勉强让一些东西工作了&#xff0…

【redis】持久化之RDB与AOF

在数字世界的脉搏中&#xff0c;数据是流淌的血液&#xff0c;而持久化则是保障系统生命力的核心机制。作为内存数据库的标杆&#xff0c;Redis凭借其高性能特性成为互联网架构的基石&#xff0c;但其「易失性」的天然属性也催生了关键命题&#xff1a;如何在服务重启或故障时保…

Brainstorm绘制功能连接图(matlab)

上篇笔记简单介绍了Brainstorm&#xff0c;本次使用Brainstorm绘制功能连接图。而对于连接矩阵&#xff0c;软件中有几种方法&#xff1a;相关、相干、双变量格兰杰因果关系、相位锁相值、包络相关、相位转移熵。 首先&#xff0c;对数据进行预处理&#xff0c;保存为.set&…

华为HG532路由器RCE漏洞 CVE-2017-17215 复现

华为HG532路由器RCE漏洞 CVE-2017-17215 CVE-Description Huawei HG532 with some customized versions has a remote code execution vulnerability. An authenticated attacker could send malicious packets to port 37215 to launch attacks. Successful exploit could l…