OmniParser v2本地部署（2）部署omnitool（包含自动化控制工具）

OmniParser v2本地部署（2）部署omnitool（包含自动化控制工具）

news2025/4/3 2:02:45

1 配置omniparserserver

1.1 配置conda环境、下载依赖和权重

我建议按照OmniParser v2本地部署（1）部署OmniParser_v2模型先设置一次，其中所创造的conda环境，和这一步相似

1.2 启动omniparserserver

进入OmniParser/omnitool/omniparserserver，激活conda环境后，python -m omniparserserver启动服务器，显示下面的信息表示启动成功
在这里插入图片描述

2 配置omnibox

2.1 安装docker

2.2 下载windows11镜像

我这里直接下载的推荐的Windows 11 Enterprise Evaluation (90-day trial, English, United States)，下面的信息随便填就行
在这里插入图片描述
然后下载指定镜像，把下载好的镜像改名为custom.iso，放到OmniParser/omnitool/omnibox/vm/win11iso

2.3 启动VM管理脚本

进入OmniParser/omnitool/omnibox/scripts，输入命令

./manage_vm.sh create

然后等待，它会一直提示waiting for a response from computer .....，是正常的，多等一等，直到显示VM + server is up and running!表示启动成功
在这里插入图片描述

3 配置gradio

进入OmniParser/omnitool/gradio，里面有个app.py
在这里插入图片描述
我建议把里面的最后一行的内容，修改成下面的情况，不然有可能因为使用了飞机而无法启动

在这里插入图片描述

运行该程序
在这里插入图片描述
进入它给的url即可进入ui界面

4 使用omnitool

我这里选择的使用通义模型，然后填入申请的API
在这里插入图片描述
我这里输入命令：关闭浏览器

左边是各种截图命令等等，右边是镜像演示，左边进行任务分析，然后在右边进行操作，试了几个简单的指令，发现并不是很智能，而且花费巨大，“打开浏览”这个操作需要0.182美元

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2307306.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

音频进阶学习十六——LTI系统的差分方程与频域分析一（频率响应）

音频进阶学习十六——LTI系统的差分方程与频域分析一（频率响应）

文章目录前言一、差分方程的有理式1.差分方程的有理分式2.因果系统和ROC3.稳定性与ROC 二、频率响应1.定义2.幅频响应3.相频响应4.群延迟总结前言本篇文章会先复习Z变换的有理分式，这是之前文章中提过的内容，这里会将差分方程和有理分式进行结合来看…

阅读更多...

JavaWeb-ServletContext应用域接口

JavaWeb-ServletContext应用域接口

文章目录 ServletContext接口简介获取一个ServletContext对象ServletContext接口中的相关方法获取应用域配置参数关于应用域参数的配置要求getContextPath获取项目路径getRealPath获取真实路径log系列方法添加相关日志增删查应用域属性 ServletContext接口简介 ServletContext…

阅读更多...

SQL命令详解之操作数据表

SQL命令详解之操作数据表

操作数据表操作数据表是数据库管理系统中用于存储、管理和操作数据的核心结构。数据表通常由行和列组成，每一列代表一种数据类型（例如，整数、字符、日期等），而每一行代表一条记录（即数据项&a…

阅读更多...

Javaweb后端数据库多表关系一对多，外键，一对一

Javaweb后端数据库多表关系一对多，外键，一对一

多表关系一对多多的表里，要有一表里的主键外键多的表上，添加外键一对一多对多案例

阅读更多...

【洛谷贪心算法题】P2240部分背包问题

【洛谷贪心算法题】P2240部分背包问题

【解题思路】贪心策略选择对于部分背包问题，关键在于如何选择物品放入背包以达到最大价值。由于物品可以分割，遍历排序后的物品数组，根据物品重量和背包剩余容量的关系，决定是将整个物品放入背包还是分割物品放入背包&#xff…

阅读更多...

SpringBoot 2 后端通用开发模板搭建（异常处理，请求响应）

SpringBoot 2 后端通用开发模板搭建（异常处理，请求响应）

目录一、环境准备二、新建项目三、整合依赖 1、MyBatis Plus 数据库操作 2、Hutool 工具库 3、Knife4j 接口文档 4、其他依赖四、通用基础代码 1、自定义异常 2、响应包装类 3、全局异常处理器 4、请求包装类 5、全局跨域配置补充：设置新建类/接…

阅读更多...

DeepSeek本地部署与Dify结合创建私有知识库指南

DeepSeek本地部署与Dify结合创建私有知识库指南

python调用本地deepseek+Dify的API使用--测试WX自动发送信息-CSDN博客 DeepSeek，一家在人工智能领域具有显著技术实力的公司，凭借其千亿参数规模的AI大模型，以及仅需0.5元人民币即可进行百万tokens的API调用成本，已经取得了令人瞩目的成就。不仅如此，DeepSeek的模…

阅读更多...

Nginx 报错：413 Request Entity Too Large

Nginx 报错：413 Request Entity Too Large

做web开发时，对于上传附件的功能，如果nginx没有调整配置，上传大一点的文件就会发生下面这种错误： 要解决上面的问题，只需要调整Nginx配置文件中的 client_max_body_size 参数即可，这个配置参数一般在http配…

阅读更多...

Arduino项目实战：使用MQ-2气体传感器与OLED屏幕监测环境气体

Arduino项目实战：使用MQ-2气体传感器与OLED屏幕监测环境气体

概述在这个项目中，MQ-2气体传感器是一个多功能的气体检测设备，能够感知多种常见气体，如甲烷、丁烷、丙烷、酒精和烟雾等。你可以把它想象成一个超级灵敏的“嗅觉”，能够帮助你实时检测环境中的各种有害气体。与Arduino板连接后，MQ-2传感器把捕捉到的气体浓度数据传送给A…

阅读更多...

C#实现本地Deepseek模型及其他模型的对话

C#实现本地Deepseek模型及其他模型的对话

前言 1、C#实现本地AI聊天功能 WPFOllamaSharpe实现本地聊天功能,可以选择使用Deepseek 及其他模型。 2、此程序默认你已经安装好了Ollama。在运行前需要线安装好Ollama,如何安装请自行搜索 Ollama下载地址： https://ollama.org.cn Ollama模型下载地址&#xf…

阅读更多...

【ESP32S3接入讯飞在线语音识别】

【ESP32S3接入讯飞在线语音识别】

视频地址：【ESP32S3接入讯飞在线语音识别】 1. 前言使用Seeed XIAO ESP32S3 Sense开发板接入讯飞实现在线语音识别。自带麦克风模块用做语音输入，通过串口发送字符“1”来控制数据的采集和上传。语音识别对比平台api教程评分百度

阅读更多...

【问题记录】Go项目Docker中的consul访问主机8080端口被拒绝

【问题记录】Go项目Docker中的consul访问主机8080端口被拒绝

【问题记录】Go项目Docker中的consul访问主机8080端口被拒绝问题展示解决办法问题展示在使用docker中的consul服务的时候，通过命令行注册相应的服务（比如cloudwego项目的demo_proto以及user服务）失败。解决办法经过分析，是…

阅读更多...

DeepSeek实现FunctionCalling调用API查询天气

DeepSeek实现FunctionCalling调用API查询天气

什么是FunctionCalling Function Calling（函数调用）是大型语言模型（如 OpenAI 的 GPT 系列）提供的一种能力，允许模型在生成文本的过程中调用外部函数或工具，以完成更复杂的任务。通过 Function Calling&am…

阅读更多...

windows设置暂停更新时长

windows设置暂停更新时长

windows设置暂停更新时长 win11与win10修改注册表操作一致 ，系统界面不同 1.打开注册表 2.在以下路径 \HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\WindowsUpdate\UX\Settings 右键新建 DWORD 32位值，名称为FlightSettingsMaxPauseDays 根据需求填写数…

阅读更多...

【Kimi】自动生成PPT-并支持下载和在线编辑--全部免费

【Kimi】自动生成PPT-并支持下载和在线编辑--全部免费

【Kimi】免费生成PPT并免费下载用了好几个大模型，有些能生成PPT内容； 有些能生成PPT，但下载需要付费； 目前只有Kimi生成的PPT，能选择模板、能在线编辑、能下载，关键全部免费！ 一、用kimi生成PP…

阅读更多...

一款在手机上制作电子表格

一款在手机上制作电子表格

今天给大家分享一款在手机上制作电子表格的，免费好用的Exce1表格软件，让工作变得更加简单。 1 软件介绍 Exce1是一款手机制作表格的办公软件，您可以使用手机exce1在线制作表格、工资表、编辑xlsx和xls表格文件等，还可以学习使用…

阅读更多...

【实战 ES】实战 Elasticsearch：快速上手与深度实践-1.3.1单节点安装（Docker与手动部署）

【实战 ES】实战 Elasticsearch：快速上手与深度实践-1.3.1单节点安装（Docker与手动部署）

👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路文章大纲 10分钟快速部署Elasticsearch单节点环境1. 系统环境要求1.1 硬件配置推荐1.2 软件依赖 2. Docker部署方案2.1 部署流程2.2 参数说明2.3 性能优化建议 3. 手动部署方案3.1 安…

阅读更多...

【Mac电脑本地部署Deepseek-r1：详细教程与Openwebui配置指南】

【Mac电脑本地部署Deepseek-r1：详细教程与Openwebui配置指南】

文章目录前言电脑配置：安装的Deepseek版本：使用的UI框架：体验效果展示：本地部署体验总结部署过程Ollama部署拉取模型运行模型Openwebui部署运行Ollama服务在Openwebui中配置ollama的服务后话前言 deepseek最近火的一塌糊涂&a…

阅读更多...

网络安全学习中，web渗透的测试流程是怎样的？

网络安全学习中，web渗透的测试流程是怎样的？

渗透测试是什么？网络安全学习中，web渗透的测试流程是怎样的？ 渗透测试就是利用我们所掌握的渗透知识，对网站进行一步一步的渗透，发现其中存在的漏洞和隐藏的风险，然后撰写一篇测试报告，提供给我…

阅读更多...

将VsCode变得顺手好用（1

将VsCode变得顺手好用（1

目录设置中文配置调试功能提效和增强相关插件主题和图标相关插件创建js文件设置中文打开【拓展】输入【Chinese】下载完成后重启Vs即可变为中文配置调试功能在随便一个位置新建一个文件夹，用于放置调试文件以及你未来写的代码，随便命名但…

阅读更多...

推荐文章

最新文章