NVIDIA AI Workbench 让 Windows 上的 GPU 使用更加简便

news2024/9/26 1:27:48

NVIDIA AI Workbench 是一款免费的、用户友好型开发环境管理器,可在您选择的系统(PC、工作站、数据中心或云)上简化数据科学、ML 和 AI 项目。在 Windows、macOS 和 Ubuntu 上,您可以本地开发、测试项目和构建项目原型,并在系统(本地和远程)之间轻松传输开发环境和计算工作,以优化成本、可用性和规模。

AI Workbench 专注于简化开发者体验,而不会阻碍高级用户所需的自定义类型。那是 AI Workbench 处理容器的主要原因。它们是提供和修改 GPU 加速工作所需环境的最简单方法。

这一重点还意味着与生态系统合作伙伴合作,以改善用户体验。例如,与 Canonical 的协作有助于使用 Ubuntu WSL 发行版在 Windows 上安装 AI Workbench。

最近,NVIDIA 与 Docker Desktop 团队合作创建了一项功能,允许 AI Workbench 直接安装 Docker Desktop。这项功能在最新的 AI Workbench 版本中提供,可显著简化 Windows 和 macOS 上的体验。

这种简化使AI Workbench成为在您自己的系统上入门的最简单方式,从笔记本电脑和工作站一直到服务器和VM。

托管式 Docker 桌面安装

Docker Desktop 是 NVIDIA AI Workbench 上适用于 Windows 和 macOS 的推荐容器运行时。然而,在选择 Docker 之前需要手动设置步骤。为了消除这些手动步骤,NVIDIA 与 Docker 合作,为本地系统安装了支持 NVIDIA AI Workbench 的 Docker Desktop。

这是 Docker 首次支持另一个应用程序为 Docker Desktop 执行托管安装。得益于此次合作,安装适用于 NVIDIA AI Workbench 的 Docker Desktop 现在变得非常简单。有关更多信息,请参阅使用 Docker Desktop 和 NVIDIA AI Workbench 优化 AI 应用程序开发(Docker 网站)。

选择 AI Workbench 的 Docker 容器运行时,系统将自动完成以下任务:

  • 安装 Docker Desktop:以前,如果尚未安装 AI Workbench 安装程序,您必须退出 AI Workbench 安装程序并手动安装 Docker Desktop。现在,您可以让 AI Workbench 安装 Docker Desktop,而无需退出 AI Workbench 安装程序。
  • 在 Windows 上配置 Docker Desktop:AI Workbench 使用其自己的 WSL 发行版,NVIDIA-Workbench。以前,Windows 用户必须手动配置 Docker Desktop 才能使用此发行版,现在,这将自动实现。

新的 AI 工作台项目

在此版本中包含一组新的示例项目,为您使用和构建。AI Workbench 项目是一个结构化的 Git 存储库,在 AI Workbench 中定义了容器化的开发环境。

这些项目支持 Jupyter 和 Visual Studio Code 等 IDE 以及用户配置的 Web 应用程序。所有内容都是容器化的、隔离的和易于修改的。你可以从 GitHub 或 GitLab 克隆项目,然后 AI Workbench 会处理所有内容,包括连接到 GPUs。

迄今为止,这方面的最佳示例是 GitHub 上的 Hybrid-RAG 项目。借助 AI Workbench,您只需克隆项目并单击几下,即可运行 RAG 应用程序。如果您没有本地 GPU,该项目允许您使用云端点或自托管 NIM 容器为您运行推理。

此版本在 GitHub 上提供了一些示例 AI 工作台项目,这些项目将继续开发 RAG 主题。此外,还有一些基于 Jupyter 的新微调项目和支持 NVIDIA RTX AI 工具包的 LlamaFactory 项目。

智能 RAG

借助 Agentic RAG AI Workbench 项目,您可以与 AI 智能体合作,将 Web 搜索工具调用纳入 RAG 工作流。智能体不仅可以处理数据库中的文档,还可以在线动态搜索新文档作为后备,以更好地响应查询。

A diagram shows the routing of user queries through either the RAG pipeline or the web search tool pipeline.

Figure 1. Structure of the agentic RAG example project.

LLM 代理是专为感知环境并作出反应而设计的系统,通常通过工具调用来更好地采取相关行动。这项项目实现了基于 LangGraph 的 RAG 代理,其中包含以下代理元素,以改进响应生成:

  • 路由:根据查询主题将相关问题路由到不同的工作流程。
  • Fallback:如果检索到的文档与查询无关,则返回 Web 搜索。
  • 自我反射:修复无法解决问题的幻觉和答案。

A GIF shows how a user query in the agentic RAG example project is routed to the RAG pipeline or the web search tool pipeline to generate a response.

图 2. 具有可自定义 Gradio 聊天 UI 的 Agentic RAG 示例项目。

此项目包含可定制的 Gradio 聊天应用,使您能够使用远程运行的端点和微服务运行推理,无论是在云端使用 NVIDIA API 目录、使用 NVIDIA NIM 的自托管端点,还是第三方自托管微服务。您可以通过聊天应用轻松切换推理模式。

随时随地进行 NIM

NIM Anywhere 是一个一体化项目,用于构建包含预配置 RAG 聊天机器人的基于 NIM 的 RAG 应用程序。

A diagram of a monitor window facing up with building blocks labeled “Libraries”, “NIM”, “IDE Config”, and “Data Stores” extending from it.

图 3.NIM Anywhere 示例项目

  • Docker 自动化:将 NIM、Milvus 和 Redis 等服务作为持久容器与主项目一起运行。
  • 用户可配置模型:在使用 NVIDIA API 目录上的 NIM 微服务或本地运行的自托管 NIM 微服务之间切换 RAG 的运行方式。
  • 可自定义前端:将视图添加到前端Gradio应用程序,以扩展项目并构建新的用例。

NIM 微服务作为 NVIDIA AI Enterprise 的一部分提供,但您也可以加入 NVIDIA 开发者计划,免费开始使用 NVIDIA NIM。

微调项目

最后,我们介绍了一些针对令人兴奋的新模型的微调工作流程。每个项目都具有可以量化的模型,以适应单个GPU:

  • Mixtral 8x7B: AI Workbench 的第一个示例项目,演示了专家混合模型 (Mixture of Experts, MoE) 的微调。
  • Llama 3 8B:一个示例项目,展示两种方法:监督式完全微调(Supervised Full Fine-tuning,SFT)和直接偏好优化(Direct Preference Optimization,DPO)。
  • Phi-3 Mini:一个小巧的模型,具备量化能力,是一个高度易于访问的微调示例。
  • RTX AI 工具包:为 Windows 应用程序开发者提供端到端工作流。您可以使用热门的基础模型,使用 Workbench 项目使用微调技术对其进行自定义,并将模型部署到 Windows 应用程序中,以在各种 NVIDIA GPU(从 NVIDIA RTX PC 和工作站到云)上获得峰值性能。您可以通过使用 AI Workbench 和 LlamaFactory 图形用户界面开始使用。

其他新功能

我们的开发流程包括用户提出的直接功能请求。以下功能基于这些用户反馈:

  • SSH 代理
  • Ubuntu 24.04
  • 日志记录

SSH 代理

Ai Workbench 的一些企业用户需要使用受密码保护的 SSH 密钥来访问遥控器。这通过在 2024.07 版本中添加 SSH 代理支持来解决这一问题。你还可以选择使用早期的 SSH 密钥功能。

Ubuntu 24.04

以前,Ubuntu 22.04 是唯一支持安装 AI Workbench 的 Linux 发行版。2024.07 版本增加了 Ubuntu 24.04 的支持。

日志记录

AI Workbench 具有多个日志文件,这些文件的查找和解释十分复杂。为了解决此问题,AI Workbench CLI 现在提供了一个支持命令,让您可以将元数据和日志导出到 zip 文件中。这消除了查找文件的需求,并包含可发送至 NVIDIA 支持部门以加快诊断和补救速度的元数据。

即将推出

以下是 AI Workbench 的发展方向:应用分享和多容器支持。

应用共享

目前,只有运行 Workbench 项目的用户才能访问该 Workbench 项目中正在运行的应用程序。一些用户已请求能够共享正在运行的应用程序。

在下一个版本中,AI Workbench 用户将能够通过链接在 Workbench 项目中安全地共享 Web 应用程序。经过身份验证的用户可以直接在 Web 浏览器中访问应用程序,而无需使用 AI Workbench。

多容器支持

当前使用 NIM Anywhere 项目的多容器方法有点变通。即将发布的 AI Workbench 版本将简化对多容器应用程序的支持。

后续步骤

通过从网页安装 AI Workbench 应用程序,开始使用 AI Workbench。已经拥有 AI Workbench 的用户可以按照说明更新到最新版本。有关更多信息,请参阅在 Windows 上安装 AI Workbench。

探索从数据科学到 RAG 的一系列 NVIDIA AI Workbench 项目示例。在 NVIDIA AI Workbench 开发者论坛上提问,并详细了解其他开发者如何使用 NVIDIA AI Workbench。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2125986.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初识Maven:Java项目管理工具

实际开发中,伴随着项目规模的增长,依赖管理和构建自动化变得至关重要,一套标准化的项目结构有助于更好的开发项目、简化这项任务(真的不是强迫症) Maven,作为 Apache Software Foundation 维护的项目管理工…

如何获取MySQL数据表的列信息

在数据库管理中,了解表的结构是至关重要的。在MySQL中,我们可以通过几种方式来获取数据表的列信息。这不仅可以帮助我们更好地理解表的结构,还可以在编写查询时提供便利。以下是三种常用的方法来获取MySQL数据表的列信息。 使用 SHOW COLUMN…

HDMI彩条显示——FPGA学习笔记12

素材来自原子哥 一、HDMI简介 英文全称是High-Definition Multimedia Interface,即高清多媒体接口。 HDMI引脚解析(A型) HDMI工作连接图 HDMI工作原理 DVI编码输出示意图 二、TMDS编码(最小化差分传输) TMDS编码框图…

pip 阿里云镜像报错 certificate verify failed: unable to get local issuer certificate

在没有管理员身份,且有防火墙限制的电脑上,pip安装​python库包失败。​但是在普通的电脑上安装正常。​​报错内容如下: (SSS_web) C:\Users\HXAIYVQ>pip install flask -i https://mirrors.aliyun.com/pypi/simple/ Looking in indexes…

302.AI学术论文搜索工具的智能体验

Hey朋友们, 你是否曾在学术的海洋里迷失方向,为了找到一篇论文而苦苦挣扎? 就像在茫茫大海中寻找灯塔,我们渴望一盏明灯,指引我们前行。 别担心,今天我来给你介绍一个超级给力的工具——302.AI学术论文…

求教0基础入门大模型的学习路线?

0基础入门大模型,transformer、bert这些是要学的,但是你的第一口不一定从这里咬下去。真的没有必要一上来就把时间精力全部投入到复杂的理论、各种晦涩的数学公式还有编程语言上,这样不仅容易让你气馁,而且特别容易磨光热情。当我…

如何系统的入门大模型?

对于刚开始接触大模型(LLM)的研究者来说,系统地学习和探索是非常重要的。以下是一个循序渐进的学习路径,帮助你高效地入门大模型的领域。 1、浏览基础资源与课程 首先,你可以通过阅读几篇公众号或知乎上的文章来了解大…

动态数字时钟屏保 提升桌面美化 电脑屏幕屏保软件

时钟屏保软件可以让你的电脑更有特色,当你离开电脑时候,屏保可以保护你的桌面隐私,还是比较有用的一款小软件,今天小编给大家推荐的这款可以实现动态数字时钟的屏保软件:芝麻时钟 (下载地址:htt…

终端显示字体背景和字体颜色

【终端显示字体背景和字体颜色等使用用法】 在命令行下想要产生五颜六色的字体和背景,只需要加上一些颜色代码即可。 ANSI 标准规定了一种所有终端共享的指令集,并要求用 ASCII 的数字字符传递所有数值信息,用于控制 Linux 终端上的光标位置…

抓包分析ARP协议工作原理

目录 1. ARP 协议 2. 工作原理 3. ARP 协议报文格式 4. ARP 缓存的查看和修改 5. tcpdump 抓包分析 ARP 协议工作原理 5.1 搭建 2 台虚拟机 5.2 在主机 192.168.0.155 打开一个shell命令行开启抓包监听 5.3 在主机 192.168.0.155 打开另一个shell命令行 telnet 192.168.…

恢复二叉搜索树

题目 给你二叉搜索树的根节点 root ,该树中的两个节点被错误地交换。请在不改变其结构的情况下,恢复这棵树。 进阶:使用 O(n) 空间复杂度的解法很容易实现。你能想出一个只使用常数空间的解决方案吗? 示例 1: 输入&…

超声眼镜波清洗机有用吗?真正好用的超声波清洗机推荐

随着时代的进步,人们对家居生活质量的追求也日益提高。尤其是对于珠宝、饰品、眼镜等小物件,长时间不使用后往往会积累灰尘和细菌,这些细菌隐藏在肉眼看不到的地方,它们对健康的影响不容忽视。幸运的是,超声波清洗机能…

Nginx怎么重新编译添加模块

转自 https://www.php.cn/faq/547300.html

【机器人建模和控制】读书笔记

机器人建模和控制——马克斯庞 A. x 1 0 x 1 ∙ x 0 x^0_1x_1\bullet x_0 x10​x1​∙x0​,其实就是: 1) x 1 x_1 x1​轴向量在 O 0 O_0 O0​系下的坐标 2)在 x 0 x_0 x0​轴上的投影 3)坐标变换矩阵的 R 1 0 R_1…

基于vue框架的城市智慧地铁管理系统73c2d(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。

系统程序文件列表 项目功能:用户,站点查询,车次线路,站点周边 开题报告内容 基于Vue框架的城市智慧地铁管理系统开题报告 一、研究背景与意义 1.1 研究背景 随着城市化进程的加速和人口的不断增长,城市交通压力日益增大。地铁作为城市公共交通的重要…

利用AI驱动智能BI数据可视化-深度评测Amazon Quicksight(一)

项目简介 随着生成式人工智能的兴起,传统的 BI 报表功能已经无法满足用户对于自动化和智能化的需求,今天我们将介绍亚马逊云科技平台上的AI驱动数据可视化神器 – Quicksight,利用生成式AI的能力来加速业务决策,从而提高业务生产…

设置广告活动目标和数字广告关键绩效指标的3个步骤

在微调广告预算、优化广告、分析数字广告关键绩效指标(KPI)和个性化着陆页面的同时,有一件事是在启动广告活动之前必须做的:确定哪些因素能使广告活动有效。 广告商很容易迷失在构成成功活动的各种指标中,但事实是&am…

20240912 每日AI必读资讯

OpenAI计划在接下来的两周内发布Strawberry - 独立产品:尽管草莓是ChatGPT的一部分,但它将作为一个独立的产品发布,具体如何提供尚不清楚。它可能会出现在用户选择的AI模型下拉菜单中,与现有服务有所不同。 - 推理功能&#xff…

红帽RHCE认证值不值得考?RHCE认证有什么用?

在IT行业,红帽认证作为一项衡量Linux技能水平的重要标准,受到了广泛的关注和认可。 拥有一张权威认证证书无疑是提升自身竞争力、实现职业发展的重要途径。 RHCE认证作为Linux领域的顶级认证之一,其价值和意义不言而喻。 那么,…

软件设计之JavaWeb(2)

软件设计之JavaWeb(2) 此篇应在MySQL之后进行学习: 路线图推荐: 【Java学习路线-极速版】【Java架构师技术图谱】 尚硅谷全新JavaWeb教程,企业主流javaweb技术栈 资料可以去尚硅谷官网免费领取 此章节最好学完JDBC观看 学习内容: HTTP简介…