如何使用 DeepSeek R1 构建开源 ChatGPT Operator 替代方案

news2025/2/18 18:47:05

开源大型语言模型(LLMs)的兴起使得创建 AI 驱动的工具比以往任何时候都更容易,这些工具可以与 OpenAI 的 ChatGPT Operator 等专有解决方案相媲美。在这些开源模型中,DeepSeek R1 以其强大的推理能力、自由的可访问性和适应性而脱颖而出。通过将 DeepSeek R1 与 Browser Use 等工具相结合,您可以构建一个强大的、完全开源的 ChatGPT Operator 替代品,而无需花费数百美元进行高级订阅。

本文将指导您完成设置 DeepSeek R1 和浏览器使用的过程,以创建能够执行复杂任务的 AI 代理,包括 Web 自动化、推理和自然语言交互。

无论您是初学者还是经验丰富的开发人员,本分步指南都将帮助您入门。

什么是 ChatGPT Operator,为什么需要开源替代品?

ChatGPT Operator 是 OpenAI 提供的一项高级功能,允许用户创建能够执行复杂任务的高级 AI 代理,例如推理、Web 自动化和多步骤问题解决。

ChatGPT Operator 每月收费 200 美元,这使得个人、小型企业或预算有限的组织更难获得。

为什么需要开源替代方案?

虽然 ChatGPT Operator 功能强大,但它有几个限制,使开源替代方案具有吸引力:

  • 成本: 每月 200 美元的订阅费对于许多用户来说可能令人望而却步。

  • 数据隐私:使用专有 API 需要将数据发送到外部服务器,这可能不符合隐私政策或法规要求。

  • 有限的定制:专有解决方案通常会限制微调或特定于任务的优化,从而限制它们对专业用例的适应性。

通过选择 DeepSeek R1Browser Use 等开源工具,您可以克服这些挑战并解锁以下几个好处:

  • 节省成本:DeepSeek R1 和 Browser Use 都是完全免费和开源的,无需订阅费用。

  • 完全控制:在本地或您自己的服务器上托管工具可确保完全的数据隐私和安全

  • 可定制性:您可以针对特定任务微调模型,将其与其他工具集成,并修改系统以满足您的独特要求。

开源方法不仅可以减少对专有平台的依赖,还可以让您能够构建针对您的需求量身定制的解决方案,同时保持对成本和数据的控制。

关键组件:DeepSeek R1 和浏览器使用

DeepSeek R1

DeepSeek R1 是一个针对推理任务优化的开源LLM软件。它在思维链问题解决、编码辅助和自然语言理解方面表现出色。它有多种尺寸(例如 1.5B、7B 参数)可供选择,使其能够适应不同的硬件功能。

浏览器使用

Browser Use 是一种开源工具,它使 AI 代理能够执行基于浏览器的任务,例如 Web 抓取、表单填写和自动导航。它提供了一个用户友好的界面,可以与 DeepSeek R1 LLMs 等集成以增强功能。

第 1 步:设置您的环境

硬件要求

  • 对于较小版本的 DeepSeek R1(例如,1.5B 参数),CPU 或中端 GPU (8GB VRAM) 就足够了。

  • 较大的版本需要高端 GPU(例如 NVIDIA A100 或 RTX 4090)。

操作系统

建议使用 Linux 或 macOS 以便于设置。Windows 用户可以使用 WSL (Windows Subsystem for Linux)。

Python 环境

创建 Python 虚拟环境以隔离依赖项:

暂时无法在飞书文档外展示此内容

安装所需的库:

暂时无法在飞书文档外展示此内容

第 2 步:使用 API 运行 DeepSeek 或使用 Ollama 在本地运行

DeepSeek API 使用

要与 DeepSeek API 交互,请按照以下更新的步骤作:

获取 API 密钥

在 DeepSeek 平台上注册并从 “API Keys” 部分生成 API 密钥。请妥善保存此密钥,因为它不会再次显示。

进行第一次 API 调用

DeepSeek API 与 OpenAI 的 API 格式兼容,因此很容易与现有的 OpenAI SDK 或软件集成。下面是一个 Python 实现的示例:

暂时无法在飞书文档外展示此内容

示例: 如果您更喜欢使用 cURL,请按以下步骤发出请求:

暂时无法在飞书文档外展示此内容

型号选择

  • 为 DeepSeek-R1 指定 model=“deepseek-reasoner”。

  • model=“deepseek-chat” 用于通用聊天任务。

对于与 OpenAI 兼容的配置,也可以将 base_url 设置为 https://api.deepseek.com/v1,但 /v1 路径与模型版本无关。

使用 Ollama 在本地运行 DeepSeek

Ollama 简化了在本地计算机上运行 DeepSeek-R1 等大型语言模型的过程。以下是正确设置和使用它的方法:

  1. 安装 Ollama

从其官方网站下载并安装 Ollama。

  1. 拉取所需的模型

使用以下命令下载 DeepSeek-R1 的特定版本:

暂时无法在飞书文档外展示此内容

  1. 在本地运行模型

下载后,使用以下命令运行模型:

暂时无法在飞书文档外展示此内容

这将启动一个交互式会话,您可以在其中直接与模型交互。

型号变体

DeepSeek 提供了几个基于 Qwen 和 Llama 架构的提炼版本,针对不同的用例进行了优化:

DeepSeek-R1-Distill-Qwen-7B

暂时无法在飞书文档外展示此内容

DeepSeek-R1-Distill-Llama-70B:

暂时无法在飞书文档外展示此内容

硬件注意事项

  • 1.5B 或 7B 等较小的型号可以在消费级 GPU 甚至 CPU 上运行。

  • 较大的型号(例如 70B)需要具有大量 VRAM 的高端 GPU(例如 NVIDIA A100 或 RTX 4090)。

  1. 通过 API 进行交互式聊天

Ollama 提供了一个 API,用于将本地运行的模型集成到您的应用程序中:

暂时无法在飞书文档外展示此内容

第 3 步:安装 Browser Use

Browser Use 使您的 AI 代理能够与 Web 浏览器交互。请执行以下步骤:

  1. 安装

从 GitHub 克隆 Browser Use 存储库:

暂时无法在飞书文档外展示此内容

  1. 配置

设置浏览器使用 WebUI:

暂时无法在飞书文档外展示此内容

在浏览器中打开 WebUI 以配置代理设置。您可以指定:

  • LLM模型(例如 DeepSeek R1)

  • 浏览器设置(例如,窗口大小)

第 4 步:结合使用 DeepSeek R1 和浏览器

要创建集成这两种工具的功能性 AI 代理,请执行以下作:

代理配置

修改 Browser Use 中的代理设置,使其与 DeepSeek R1 连接:

暂时无法在飞书文档外展示此内容

运行代理

启动 DeepSeek R1 和浏览器使用:

暂时无法在飞书文档外展示此内容

一旦这两项服务都运行起来,代理就可以自主执行填写表单、抓取数据或导航网站等任务。

第 5 步:及时工程以获得更好的结果

要优化 AI 代理的性能,请使用提示工程技术。例如:

通用提示模板

暂时无法在飞书文档外展示此内容

此结构可确保清晰度并提高任务执行准确性。以下是一些您可以通过运行来尝试的演示:

暂时无法在飞书文档外展示此内容

示例 1

提示:在 Google Docs 中写一封信给我爸爸,感谢他所做的一切,并将文档保存为 PDF。

示例 2

提示:查找往 北京 的 kayak.com 航班,时间从 2024.12.25 到 02.02.2025。

示例 3

提示:阅读我的简历并找到ML工作,将它们保存到一个文件中,然后在新的标签页中开始申请它们,如果你需要帮助,就问我。


结论

通过将 DeepSeek R1 与浏览器使用相结合,您可以构建一个功能齐全的 ChatGPT Operator 替代方案,该替代方案免费、开源且高度可定制。这种设置不仅可以节省成本,还可以让您完全控制数据隐私和系统行为。

无论您是自动化 Web 任务、构建对话代理,还是尝试使用 Retrieval-Augmented Generation 等高级 AI 功能,本指南都提供了您入门所需的一切。立即拥抱开源的力量,创建您自己的智能助手!

Deepseek API 直接调用教程

如果 API Key 有了之后,我们就可以调用它了,通过 Apifox 集成 Deepseek API,可快速完成 API 调试。

第一步:填写 API Key

获得 API 密钥后,你可以在 API 文档中开始使用它,无需编写代码:

  1. 访问由 Apifox 创建的 DeepSeek 在线 API 文档

  1. 打开 Apifox 桌面:点击页面上的「Run in Apifox」,在弹出的窗口中点击「在桌面上打开」,引导你进入 Apifox 的桌面版本(如果你尚未下载该应用程序,则需要先下载)。

下载最新版 Apifox

  1. 输入你的 API 密钥:打开文档后,在 Apifox 中选择一个接口,点击「Auth」,选择「Bearer Token」。然后复制之前创建的令牌,将其粘贴「Token」上密钥保存在本地,因此不存在泄露风险。

还有一种方法设置 API Key,在项目右上角的 “环境管理” 中,点击“正式环境”,这个环境变量的值就是上面创建的 Deepseek API 的 API Key,添加完成后保存即可。

第二步:调用 API

  1. 点击“发送”即可调用 API。如果调用成功,API 响应将显示在下面的页面中。

  1. 修改 Body 中的 messages 里的信息,你就可以实现不同的对话。

  1. 如果要实现流式输出,可以将 stream 的值改为 true

💡

通过指定 model='deepseek-chat' 即可调用 DeepSeek-V3。 通过指定 model='deepseek-reasoner',即可调用 DeepSeek-R1。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2298343.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【教程】MySQL数据库学习笔记(七)——多表操作(持续更新)

写在前面: 如果文章对你有帮助,记得点赞关注加收藏一波,利于以后需要的时候复习,多谢支持! 【MySQL数据库学习】系列文章 第一章 《认识与环境搭建》 第二章 《数据类型》 第三章 《数据定义语言DDL》 第四章 《数据操…

Word 公式转 CSDN 插件 发布

经过几个月的苦修,这款插件终于面世了。 从Word复制公式到CSDN粘贴,总是出现公式中的文字被单独提出来,而公式作为一个图片被粘贴的情况。公式多了的时候还会导致CSDN禁止进一步的上传公式。 经过对CSDN公式的研究,发现在粘贴公…

【ESP32接入国产大模型之Deepseek】

【ESP32接入国产大模型之Deepseek】 1. Deepseek大模型1.1 了解Deepseek api1.2 Http接口鉴权1.3. 接口参数说明1.3.1 请求体(request)参数1.3.2 模型推理 2. 先决条件2.1 环境配置2.2 所需零件 3. 核心代码3.1 源码分享3.2 源码解析3.3 连续对话修改后的代码代码说明示例输出注…

C语言蓝桥杯1003: [编程入门]密码破译

要将"China"译成密码,译码规律是:用原来字母后面的第4个字母代替原来的字母. 例如,字母"A"后面第4个字母是"E"."E"代替"A"。因此,"China"应译…

SolidWorks速成教程P3-3【零件 | 第三节】——草图绘制面实线与构造线的区别

经过了前面的特征学习后,是不是感觉对 SolidWorks越来越熟悉了?不过发现, SolidWorks速成这套教程,对于一些基础问题,还是需要解释得更详细一些,所以在这节再补充一下草图绘制面&实线与构造线的区别。 目录 1.草图绘制面 2.实线与构造线的区别 1.草图绘制面 之前…

win10中mstsc远程Centos-Stream 9图形化界面

文章目录 1 前置状态2 安装配置XRDP3 关闭SELinux3.1 查看selinux状态3.2 关闭selinux 4 启动XRDP5 Win10远程连接测试 1 前置状态 已安装CentOS9桌面版;Windows10。 2 安装配置XRDP sudo yum install epel-release sudo yum install xrdp sudo yum install tige…

中国AI“拥抱开源”给世界的启示——Anko

事实证明,中国AI企业“拥抱开源”,不仅为自身发展开拓了新路径,也带动AI企业跨国合作的需求,并推动全球AI生态向“开源普惠”转型。Anko通过免费开放部分模型功能,将AI时代的数字红利公平地派发到每一位网民手中&#…

DeepSeek处理自有业务的案例:让AI给你写一份小众编辑器(EverEdit)的语法着色文件

1 DeepSeek处理自有业务的案例:让AI给你写一份小众编辑器(EverEdit)的语法着色文件 1.1 背景 AI能力再强,如果不能在企业的自有业务上产生助益,那基本也是一无是处。将企业的自有业务上传到线上训练,那是脑子进水的做法&#xff…

Jenkins 配置 Git Parameter 四

Jenkins 配置 Git Parameter 四 一、开启 项目参数设置 勾选 This project is parameterised 二、添加 Git Parameter 如果此处不显示 Git Parameter 说明 Jenkins 还没有安装 Git Parameter plugin 插件,请先安装插件 Jenkins 安装插件 三、设置基本参数 点击…

网络工程师 (38)流量和差错控制

一、流量控制 流量控制是一种协调发送站和接收站工作步调的技术。它的主要目的是防止发送端发送数据过快,导致接收端缓冲区溢出,从而造成数据丢失。流量控制机制通过调整发送速率来匹配接收端的处理能力。 基本原理 发送站每发出一帧数据,就进…

从零开始:Django初学者的实战之旅

一、概念引入 要基于编程开发一个完整的企业项目不管什么样的项目,基本都有3种不同的开发模式,这几种开发模式,如果把项目类比成建造房子则有如下: 1.原生开发:类似从0开始造房子,从0开始构建项目&#xf…

青果教务系统逆向(js逆向)

首先我们打开f12检查以下登录函数 可以看到登录函数在checkrand中,直接去全局搜索函数 在这里,打个断点直接跳进去 可以看到参数在这里形成 这是我们发起请求需要的参数,把这几个参数加进去直接登录就行 那就一个一个看呗,第一…

在Linux中Redis不支持lua脚本的处理方法

redis安装在IP为x.x.x.x的服务器上 redis安装 第一步,安装前,检测系统是否安装了redis。若安装了redis,则需要删除redis;若没有安装redis,则需要安装2.6版本以上的redis。 # 确保Redis版本支持Lua脚本。从Redis 2.6…

WPF进阶 | 深入 WPF 依赖项属性:理解其强大功能与应用场景

WPF进阶 | 深入 WPF 依赖项属性:理解其强大功能与应用场景 前言一、依赖项属性基础概念1.1 什么是依赖项属性1.2 依赖项属性与 CLR 属性的区别1.3 依赖项属性的定义与注册 二、依赖项属性的原理深入剖析2.1 依赖项属性系统的工作机制2.2 元数据(Metadata…

关于 IoT DC3 中设备(Device)的理解

在物联网系统中,设备(Device)是一个非常宽泛的概念,它可以指代任何能够接入系统并进行数据交互的实体。包括但不限于手机、电脑、服务器、网关、硬件设备甚至是某些软件程序等所有能接入到该平台的媒介。 内容 定义 目的 示例 …

从 0 开始本地部署 DeepSeek:详细步骤 + 避坑指南 + 构建可视化(安装在D盘)

个人主页:chian-ocean 前言: 随着人工智能技术的迅速发展,大语言模型在各个行业中得到了广泛应用。DeepSeek 作为一个新兴的 AI 公司,凭借其高效的 AI 模型和开源的优势,吸引了越来越多的开发者和企业关注。为了更好地…

Uniapp 获取定位详解:从申请Key到实现定位功能

文章目录 前言一、申请定位所需的 Key1.1 注册高德开发者账号1.2 创建应用1.3 添加 Key 二、在 Uniapp 中配置定位功能2.1 引入高德地图 SDK2.2 获取定位权限 三、实现定位功能3.1 使用 uni.getLocation 获取位置3.2 处理定位失败的情况3.3 持续定位3.4 停止持续定位 四、总结 …

Spring系统学习——持续更新

spring概述 1.轻量级的开源的JAVAEE框架 2.解决企业应用开发的复杂性 3.两大核心 :IOC(控制反转)和AOP(面向切面) 4.Spring特点: 1.方便解耦,简化开发。2.Aop编程支持3.方便程序测试4.方便和其…

QT笔记——QRadioButton

文章目录 1、概要2、实际的应用2.1、创建多个QRadioButton,只可同时选中其中一个,点击后实现对应的槽函数 1、概要 实现QRadioButton相关的应用;2、实际的应用 2.1、创建多个QRadioButton,只可同时选中其中一个,点击后实现对应的槽函数 创建…

微服务面试题:远程调用

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…