AutoDL部署视觉大模型llama3.2-vision,从视频中寻找特定目标

news2025/1/19 23:19:15

注: windows11系统。示例为此项目:https://github.com/win4r/VideoFinder-Llama3.2-vision-Ollama

在当今的人工智能领域,深度学习模型的计算需求日益增长,特别是在处理复杂的视觉任务时,强大的算力往往是实现高效应用的关键。如果您的算力有限,租用云服务器无疑是一个高性价比的选择。在众多服务平台中,AutoDL AI算力云https://www.autodl.com/home凭借其卓越的性价比和强大的算力资源,成为了许多开发者和企业的首选。本文将以部署 Ollama 的视觉大模型 llama3.2-vision 为例,详细介绍如何在 AutoDL 平台上进行模型的部署。我们将利用 llama3.2-vision 的图像分析功能,展示如何从视频中寻找特定目标,从而帮助读者快速上手并高效实现目标检测任务。

**为便于测试我已将项目源代码、Linux下的Ollama安装文件已分享:链接:https://pan.baidu.com/s/1Wfv15jS3hBVEnQ4tHamLSA?pwd=r8vs **

1、租用服务

注册、充值、创建实例
在这里插入图片描述

2、配置环境

  • 点击JupyterLab->启动页->进入终端
    在这里插入图片描述

  • 初始化base环境
    终端输入conda init, 关闭此终端,重新开启新的终端,初始化生效。
    | 在这里插入图片描述
    在这里插入图片描述

3、上传项目压缩文件

上传前可以将压缩文件名改一下,我这里改为VideoFinder.zip, 当然你上传后在文件上右键亦可重命名。
在这里插入图片描述

4、解压项目

# 解压
unzip VideoFinder.zip

将解压后的文件夹我也重命名为VideoFinder。

5、创建项目运行环境

# 创建虚拟环境
conda create -n VideoFinder 
# 激活虚拟环境
conda activate VideoFinder
# 进入项目目录
cd VideoFinder
# 安装项目依赖
pip install -r requirements.txt 

6、安装ollama

参考https://github.com/ollama/ollama 依照官网给出的安装命令,安装非常慢!非常慢!非常慢!可以采用后面的方法。

curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3.2-vision

可以将Linux下的安装文件下载到本地后上传到AutoDL 上,再进行安装。

准备工作

  1. 下载并上传文件
    • 从官方网站下载 Ollama 的 Linux 安装文件(ollama-linux-amd64.tgz)。
    • 上传该文件到 autodl-tmp 文件夹(可以通过直接拖拽或使用其他上传方式)。

安装和配置步骤

  1. 解压和安装 Ollama

    # 进入上传文件的目录
    cd ~/autodl-tmp
    
    # 解压文件到 /usr 目录
    sudo tar -C /usr -xzf ollama-linux-amd64.tgz
    
    # 确保 Ollama 可执行
    sudo chmod +x /usr/bin/ollama
    
  2. 配置环境变量

    • 使用以下命令修改 /etc/profile 文件以设置 Ollama 的相关环境变量:
    # 在文件末尾添加以下两行
    echo 'export OLLAMA_HOST="0.0.0.0:6006"' | sudo tee -a /etc/profile
    echo 'export OLLAMA_MODELS="/root/autodl-tmp/models"' | sudo tee -a /etc/profile
    
    # 使以上配置生效
    source /etc/profile
    
    # 验证配置是否生效
    echo $OLLAMA_HOST   # 如果输出 "0.0.0.0:6006" 则配置成功。
    
  3. 启动 Ollama 服务

    # 启动 Ollama 服务并让它在后台运行
    nohup ollama serve &
    
    # 检查 Ollama 是否正在运行
    ps aux | grep '[o]llama'
    

    在这里插入图片描述

7、运行视觉大模型llama3.2-vision

在启动ollama服务后,运行以下指令

# 启动llama3.2-vision, 如果第一次运行会拉取模型  11B近8个G,90B的有55个G,如果你想跑90B的要租更牛B的服务器了。
ollama run llama3.2-vision

在这里插入图片描述

8、运行程序

1、将欲要分析的视频上传至项目目录下,在终端运行程序, 视频名称和要找的目标在程序入口处修改。

视频地址:https://cdn.pixabay.com/video/2020/02/13/32287-391434445_large.mp4

python app.py

在这里插入图片描述
在这里插入图片描述
2、以网页形式运行

python main.py

程序启动,在本地http://0.0.0.0:8000上运行。

在这里插入图片描述

在本地访问服务器上的服务,使用“2.配置环境”图中的“自定义服务”, 安装隧道工具。
在这里插入图片描述
网页中访问
在这里插入图片描述
在本文中,我们探讨了在 AutoDL 平台上成功部署 Ollama 的视觉大模型 llama3.2-vision 的全过程。在实际部署过程中,我们详细解析了模型的调用方式,介绍了如何有效地进行图像预处理,并探讨了如何解读和解析分析结果。得益于 llama3.2-vision 的强大能力,我们能够实现快速而精准的目标识别和视频内容分析。这种技术的应用不仅为智能监控和安防领域带来了巨大的便利,还为其他相关场景提供了可靠的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2243317.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【大语言模型】ACL2024论文-16 基于地图制图的罗马尼亚自然语言推理语料库的新型课程学习方法

【大语言模型】ACL2024论文-16 基于地图制图的罗马尼亚自然语言推理语料库的新型课程学习方法 目录 文章目录 【大语言模型】ACL2024论文-16 基于地图制图的罗马尼亚自然语言推理语料库的新型课程学习方法目录摘要:研究背景:问题与挑战:如何解…

golang调用模组程序实现交互输入自动化,获取imei及iccid

应用场景:在openwrt下调用移远的测试程序,并实现输入自动话,获取imei rootOpenWrt:~# ql-api-test Test groups:0: ql_dsi1: ql_nw2: ql_sim3: ql_dev4: ql_voice5: ql_sms6: ql_adc7: ql_i2c8: …

【数据分享】2022年我国10米分辨率茶树种植分布栅格数据

小麦、玉米、水稻、茶树等各类农作物的种植分布数据在农业、环境、国土等很多专业都经常用到! 本次给大家分享的是我国2022年10米分辨率茶树种植分布栅格数据!数据格式为TIFF格式。数据坐标为GCS_WGS_1984。数据格式为TIFF格式。数据坐标为GCS_WGS_1984…

【弱监督视频异常检测】2024-ESWA-基于扩散的弱监督视频异常检测常态预训练

2024-ESWA-Diffusion-based normality pre-training for weakly supervised video anomaly detection 基于扩散的弱监督视频异常检测常态预训练摘要1. 引言2. 相关工作3. 方法论3.1. 使用扩散自动编码器进行常态学习3.2. 全局-局部特征编码器3.2.1 局部块3.2.2 全局块3.2.3 协同…

vue实现展示并下载后端返回的图片流

// 点击下载 downLoadCode() {const image new Image();image.setAttribute("crossOrigin", "anonymous");image.onload () > {const canvas document.createElement("canvas");canvas.width image.width;canvas.height image.height;c…

STL关联式容器之平衡二叉搜索树

平衡二叉搜索树 在STL关联式容器介绍-CSDN博客中对二叉搜索树做了简要的描述;但是因为没有对二叉搜索树对数的深度及插入后树的结构进行调整,二叉搜索树可能失去平衡,造成搜寻效率低落的情况。如下所示: 所谓树形平衡与否&#xf…

Django启用国际化支持(2)—实现界面内切换语言:activate()

文章目录 ⭐注意⭐1. 配置项目全局设置:启用国际化2. 编写视图函数3. 配置路由4. 界面演示5、扩展自动识别并切换到当前语言设置语言并保存到Session设置语言并保存到 Cookie ⭐注意⭐ 以下操作依赖于 Django 项目的国际化支持。如果你不清楚如何启用国际化功能&am…

Java基础——继承和多态

目录 一、继承 继承的定义: 继承的基本用法: 如何调用父类的方法? 二、多态 多态性的好处 多态中的强制类型转换: 包的命名规则——域名倒叙 一、继承 继承的定义: 继承是面向对象编程中的一种机制&#xff0c…

2024-11-17 -MATLAB三维绘图简单实例

1. x -1:0.05:1; y x; [X, Y] meshgrid(x, y); f (X, Y) (sin(pi * X) .* sin(pi * Y)) .^ 2.*sin(2.*X2.*Y); mesh(X, Y, f(X, Y)); % 调用函数f并传递X和Y xlabel(X-axis); ylabel(Y-axis); zlabel(Z-axis); title(Surface Plot of (sin(pi * X) .* sin(pi * Y)) .^ 2.*…

resnet50,clip,Faiss+Flask简易图文搜索服务

一、实现 文件夹目录结构&#xff1a; templates -----upload.html faiss_app.py 前端代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widt…

Flink监控checkpoint

Flink的web界面提供了一个选项卡来监控作业的检查点。这些统计信息在任务终止后也可用。有四个选项卡可以显示关于检查点的信息:概述(Overview)、历史(History)、摘要(Summary)和配置(Configuration)。下面依次来看这几个选项。 Overview Tab Overview选项卡列出了以…

如何用Excel批量提取文件夹内所有文件名?两种简单方法推荐

在日常办公中&#xff0c;我们有时需要将文件夹中的所有文件名整理在Excel表格中&#xff0c;方便管理和查阅。手动复制文件名既费时又易出错&#xff0c;因此本文将介绍两种利用Excel自动提取文件夹中所有文件名的方法&#xff0c;帮助你快速整理文件信息。 方法一&#xff1…

微信小程序-prettier 格式化

一.安装prettier插件 二.配置开发者工具的设置 配置如下代码在setting.json里&#xff1a; "editor.formatOnSave": true,"editor.defaultFormatter": "esbenp.prettier-vscode","prettier.documentSelectors": ["**/*.wxml"…

Debezium日常分享系列之:Debezium3版本Debezium connector for JDBC

Debezium日常分享系列之&#xff1a;Debezium3版本Debezium connector for JDBC 概述JDBC连接器的工作原理消费复杂的Debezium变更事件至少一次的传递多个任务数据和列类型映射主键处理删除模式幂等写入模式演化引用和大小写敏感性连接空闲超时数据类型映射部署Debezium JDBC连…

前端页面自适应等比例缩放 Flexible+rem方案

在移动互联网时代&#xff0c;随着智能手机和平板电脑的普及&#xff0c;前端开发者面临的一个重要挑战是如何让网页在不同尺寸和分辨率的设备上都能良好地显示。为了应对这一挑战&#xff0c;阿里巴巴的前端团队开发了 flexible.js&#xff0c;旨在提供一种简单有效的解决方案…

Argo workflow 拉取git 并使用pvc共享文件

文章目录 拉取 Git 仓库并读取文件使用 Kubernetes Persistent Volumes&#xff08;通过 volumeClaimTemplates&#xff09;以及任务之间如何共享数据 拉取 Git 仓库并读取文件 在 Argo Workflows 中&#xff0c;如果你想要一个任务拉取 Git 仓库中的文件&#xff0c;另一个任…

AWTK VSCode 实时预览插件端口冲突的解决办法

AWTK XML UI 预览插件&#xff1a;在 vscode 中实时预览 AWTK XML UI 文件&#xff0c;在 Copilot 的帮助下&#xff0c;可以大幅提高界面的开发效率。 主要特色&#xff1a; 真实的 UI 效果。可以设置主题&#xff0c;方便查看在不同主题下界面的效果。可以设置语言&#xf…

x-cmd pkg | helix - 用 Rust 打造的文本编辑器,内置 LSP 和语法高亮,兼容 Vim 用户习惯

目录 简介快速上手安装使用 功能特点竞品和相关项目进一步阅读 简介 helix 是用 Rust 开发的文本编辑器&#xff0c;以 Modal editing&#xff08;模态编辑&#xff09;为核心特性&#xff0c;类似于 Vim。它结合了经典的 Vim 模式编辑和现代开发工具的特性&#xff08;如 LSP…

资源管理功能拆解——如何高效配置和管理项目资源?

在任何一个项目中&#xff0c;资源的合理配置和高效管理是决定项目成败的关键因素。无论是人力、物资还是时间&#xff0c;每一个资源的使用都直接关系到项目的执行效果和企业的成本控制。因此&#xff0c;如何在项目管理中实现资源的高效配置和监控&#xff0c;成为了企业管理…

SpringCloud OpenFeign负载均衡远程调用 跨服务调用 连接池优化

介绍 Spring Cloud OpenFeign 是 Spring Cloud 的一部分&#xff0c;提供了一种声明式的 HTTP 客户端方式来简化服务间的通信。通过 OpenFeign&#xff0c;开发者可以像调用本地方法一样&#xff0c;轻松地调用远程服务&#xff0c;而不需要手动处理 HTTP 请求、响应和连接等底…