如何构建成功的计算机视觉应用

news2024/11/15 11:59:40

引导计算机视觉项目从原型进入生产

随着现有图像数据量的增长以及人工智能 (AI) 对全球企业重要性的日益增强,计算机视觉正在一些行业快速发展。计算机视觉是机器学习 (ML) 的一种形式,它帮助计算机“看到”与人眼所见类似的图像,并对图像进行注释。通过对图像和其中的对象进行分类,计算机可以对所视内容作出反应,并根据具体使用场景提供增强的预测、客户体验和安全性。

AI 领域出现诸多计算机视觉应用,其使用率预计将随着时间的推移呈指数级增长。例如,医疗行业的计算机视觉应用预计将从 2019 年的约 4 亿美元增长到 2025 年底的 13 亿美元,而 30% 的零售商将在未来 12 个月内采用最先进的 计算机视觉 技术。预计到 2025 年,整个 计算机视觉 市场的规模将达到 182.4 亿美元,在全球 AI 市场中占据很大的份额(全球 AI 市场的规模到 2026 年将达到惊人的 680 亿美元)。

尽管计算机视觉项目在快速增长,但许多企业仍然难以建立起部署信心,主要原因是缺乏高质量的数据,并且对构建自动化 AI 流程的了解有限。要释放业务价值,必须克服这些挑战,并且是以一种可扩展的方式进行。

有哪些成功的计算机视觉应用?

许多组织已在其计算机视觉应用方面取得了成功,从而获取业务价值。下面的案例分析重点介绍不同行业的成功案例。

电商

Shotzr 是一个面向市场营销专业人员的图像数据库,其中有超过 7 千万张图片。他们找到澳鹏(Appen),想通过高质量的训练数据为营销人员打造更加个性化和本地化的搜索体验。利用图像分类计算机视觉,Shotzr 让各种各样的众包人员为图片添加相关的类别标签(例如时尚、自然和生活方式)。他们随后将这些图片输入到其平台的搜索算法中,从而改善推荐和搜索体验。由于营销人员能够搜索到更具相关性的图片和内容,平台的使用率增长了 20%。

零售业

机器人技术是AI的一个让人激动的 领域,它需要依赖 计算机视觉技术。零售企业正在为自己的商店配置机器人,用来跟踪库存状态并确认哪些商品库存量低或已经缺货。考虑到全球每年因缺货商品造成的收入损失达到 4480 亿美元,此举有可能为大型零售商节省大量成本。

机器人使用对象检测技术,该技术通过图像标注来确认产品是否缺货,并通过光学字符识别(使用图像转录)扫描条形码和输出产品名称与价格。

农业

John Deere 采用计算机视觉算法来识别农田中的杂草,塑造了农药使用的新局面。通过像素级图像分割,可以训练 AI 区分图像的哪个部分是农作物,哪个部分是杂草。这样,农民就可以使用无人机将农药只喷洒在杂草上,从而有望将农药成本降低 90%。

汽车业

HERE 公司利用视频、图像和文本数据为许多行业创建精确的地图。他们的路标检测算法具有 ML 辅助视频对象跟踪功能,他们的平台还可以使用光学字符识别算法,通过带边框的商业标牌识别出企业。HERE 使用像素级语义分割在卫星地图上标注建筑物的行人入口、楼层数等信息。

该公司还使用视频标注来跟踪汽车、交通工具和行人。我们的工具提供了增强的机器辅助功能,使模型能够跟踪每个对象的运动,从而使该对象的人工标注更加易于管理。

这些案例证明了计算机视觉为许多重点行业的企业节省大量成本的能力,同时也凸显了训练数据为他们的成功贡献的价值。

如何开展计算机视觉项目

计算机视觉项目

开展计算机视觉项目的关键是建立可扩展的自动化模型流程。以下步骤将以自动驾驶汽车为例,带您了解整个过程。

1. 业务问题

明确定义一个将为您的组织带来价值的业务问题。识别参与执行解决方案的关键利益相关者,并获得他们对项目的批准和理解。请务必评估这项工作的优先级,以及您的组织愿意投入的资金规模。

在开发自动驾驶汽车的情况下,业务价值可以是更高的收入,也可以是对获得竞争优势的渴望。

2. 数据

准备训练数据涉及许多步骤,包括收集、清理、分段、标注、处理和分析。您还会希望有适当的数据治理程序来监控安全问题。(下一节将详细介绍训练数据的重要性。)

在我们的自动驾驶汽车示例中,首先从汽车的摄像头、LiDAR 和 RADAR 中收集同步传感器数据,然后将其移植到中央存储单元。汽车制造商还可以选择利用来自开源或成品数据集的相关传感器数据。数据标注的方法有很多。例如,点云视频对象跟踪就是一种 CV 标注技术,它可以跟踪 3D 空间中的对象(也许有助于了解汽车与其他物品交互的方式)。

3. 模型构建

在模型构建阶段,需要使用准备好的数据和超参数来训练算法,优化特征提取,分析输出,再训练,直到模型达到所需的精度阈值为止。您可以使用冠军挑战者模型进行测试,用一个初始模型作为接受挑战的模型。您提出另一个模型,即挑战者模型,并对两个模型进行 A/B 测试,表现较佳的模型成为冠军模型。您可能必须通过这个过程进行几百次甚至几千次迭代,直到获得您想要的模型。

对于自动驾驶汽车,您可能需要训练一个模型或五个不同的模型(需要多样化的数据收集和标注过程,并将模型融合在一起以创建最终模型)。在测试模型时,您要通过迭代(例如温度、天际线之上发生的事情或与驾驶相关的其他因素)来增加复杂性。自动驾驶汽车还需要在真实环境中进行现场测试,以确保车辆可以在各种条件下工作。

4. 部署

得到冠军模型后,您要评估该解决方案能否解决您一开始定义的业务问题,以及它能否提供预期的业务价值。如果不能,您要重复整个过程以进行调整。如果您的模型已经准备就绪,就可以将其与现有业务流程集成,然后进行部署。采用适当的工具继续评估模型在部署后的表现。

部署有多种含义。对于自动驾驶汽车来说,就是需要将一个物理组件(很像一件可穿戴设备)安装到车辆上。

5. 主动学习和调整

部署模型后,您的工作还没结束。您现在进入了模型维护模式,需要进行持续的更新和监督。可使用人机协同的方法来提供真实情况并进行成功的监控,以降低模型偏差。另外,您需要继续检查模型预测中的偏差,并在必要时向模型提供反馈。

随着全球道路状况的发展,您需要对自动驾驶汽车中的 AI 进行持续更新。

训练数据:计算机视觉项目的核心

用另一个同样准确的标题表述的话,可以说:训练数据是所有机器学习项目的核心。如果没有高质量的训练数据,AI 模型将难以做出准确、高置信度的预测,并因此无法为最终用户提供满意的服务。在构建 AI 时,训练数据是成功的必备要素。那么您应该考虑哪些与数据有关的因素呢?以下问题将帮助您创建有效的数据管理策略:

目标和项目优先事项

  • 您的质量目标是什么?
  • 您计划如何训练和调整模型?
  • 您的数据需求是什么?

数据采集

  • 您需要多少数据?
  • 您从哪里获得数据?
  • 您的数据多样性是否足以避免过度拟合?
  • 您如何传送数据?
  • 您如何在部署后继续收集数据?

数据标注

  • 您需要哪种类型的数据标注?
  • 哪些标注工具最适合您的需求?
  • 谁来标注您的数据?您需要特定的技能和语言专长吗?

数据流程和扩展

  • 您计划如何自动化 AI 数据流程?
  • 您是否会纳入“人机交互”?
  • 您如何对模型进行持续训练?
  • 这些问题绝非详尽无遗,但有助于您探索一些必要的途径,以便准备高质量的训练数据并构建和维护成功的模型。

为未来而优化

构建有效的、高性能的计算机视觉应用的模型关系到优化数据和模型流程并避免常见错误。您需要建立持续的学习循环来不断重新训练和挑战冠军模型,从而解决数据偏差和模型陈旧问题。您需要设置可重复的自动化工作流程,以便设计可扩展的模型。您还需要创建全面的数据治理框架,以促进高质量训练数据的准备工作。这些行动将共同帮助您从试用阶段进入部署和生产阶段并走得更远。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1132590.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

竞赛 深度学习卷积神经网络垃圾分类系统 - 深度学习 神经网络 图像识别 垃圾分类 算法 小程序

文章目录 0 简介1 背景意义2 数据集3 数据探索4 数据增广(数据集补充)5 垃圾图像分类5.1 迁移学习5.1.1 什么是迁移学习?5.1.2 为什么要迁移学习? 5.2 模型选择5.3 训练环境5.3.1 硬件配置5.3.2 软件配置 5.4 训练过程5.5 模型分类效果(PC端) 6 构建垃圾…

博通BCM575系列RDMA网卡驱动分析(一)

简介 整个BCM系列驱动分成以太网部分(bnxt_en.ko)和RDMA部分(bnxt_re.ko), 两个模块之间通过内核的auxiliary_bus进行管理.我们主要分析下bnxt_re驱动. 代码结构 这个驱动的核心是 qplib_fp.c, 这个文件主要包含了驱动的数据路径, 包括Post Send, Post Recv, Poll CQ流程的实…

迭代器的封装与反向迭代器

一、反向迭代器 在list模拟实现的过程中,第一次接触了迭代器的封装,将list的指针封装成了一个新的类型,并且以迭代器的基本功能对其进行了运算符重载 反向迭代器是对正向迭代器的封装,并且体现了泛型编程的思想,任意…

PX30 android8.1添加RTL8723DU

将8723du复制到kernel/drivers/net/wireless/rockchip_wlan/rtl8723du 并修改makefile 修改平台 CONFIG_PLATFORM_I386_PC nCONFIG_PLATFORM_ARM_RK3188 y 修改 ifeq ($(CONFIG_PLATFORM_ARM_RK3188), y) EXTRA_CFLAGS -DCONFIG_LITTLE_ENDIAN -DCONFIG_PLATFORM_ANDRO…

【C语言】指针那些事之数组传参和指针传参的区别

C语言系列 文章目录 目录 C语言系列 文章目录 前言 一,数组传参和指针传参 1.1一维数组传参 1.2二维数组传参 1.3一级指针传参 1.4当一个函数的参数部分为一级指针的时候,函数可以接收什么参数 1.5二级指针传参 1.6当函数的参数为二级指针的时…

服务器动态/静态/住宅/原生IP都是什么意思

​  在互联网的世界中,我们经常会听到关于IP地址的各种说法,比如服务器动态IP、静态IP、住宅IP和原生IP。那么这些术语究竟代表着什么意思呢?让我们一起来了解一下。 动态IP 动态IP(Dynamic IP)是指互联网服务提供商(ISP)在每次用户上网时&#xff0c…

智安网络|探索语音合成技术的未来:揭秘人工智能配音技术的背后

随着人工智能技术的迅猛发展,配音行业也迎来了人工智能配音技术的崭新时代。人工智能配音技术通过语音合成和自然语言处理等技术手段,实现了逼真的语音合成,为影视、广告和游戏等领域带来了新的可能性。 第一部分:语音合成技术的…

求臻医学:肺癌患者就诊指南及基因检测意义

2023年国家癌症中心公布的最新的数据显示,中国癌症新发病例数前十的癌症分别是:肺癌82万,结直肠癌56万,胃癌48万,乳腺癌42万,肝癌41万,食管癌32万,甲状腺癌22万,胰腺癌12…

塔式服务器介绍

大家都知道服务器分为机架式服务器、刀片式服务器、塔式服务器三类,今天小编就分别讲一讲这三种服务器,第三篇先来讲一讲塔式服务器的介绍。 塔式服务器定义:塔式服务器的外观和普通电脑差不多,直立放置。机箱比较大,服…

信息安全应急响应小组 诚招

介绍 小组接触领域:攻防领域CISP认证,CTF,工业自动化控制,工业网络,机械制图等 小组成立意义;致力于解决公司内外网安全,高校内外网安全,CTF赛题分析,工控领域内网安全等 小组

Stable Diffusion WebUI扩展canvas-zoom详细讲解

canvas-zoom这是什么? 这是一个针对画布做一些操作的工具,比如缩放等。 下面来详细说一下这些操作的热键。 重要的热键: 缩放(Alt+滚轮)、移动画布 (F)、全屏 (S) 和重置缩放 (R) (1)Shift + wheel - 缩放画布 按住Shift + 滚轮之后,一点反应都没有,之后按…

VR全景应用广泛体现在哪里?有何优势?

VR全景作为一种新型营销方式,正在逐渐走进人们的视线,它区别于以往单一角度的照片和视频,VR全景制作显得更加直观、更加真实、更加生动。VR全景通过VR技术将所拍摄的图片变成720度可观看的场景模式,把产品的特色以及魅力整体呈现展…

微电子/集成电路专业学术期刊汇总!

1. JSSC (IEEE Journal of Solid-State Circuits ) IEEE SSCS 旗下的旗舰期刊。IC领域公认的顶刊,难度最大,认可度最高。2020年刚升为一区。 虽然IF只有6.1,但其在IC圈影响力碾压众多一区高分期刊。 投这个期刊必须要有流片和测试结果&…

文件防泄密软件哪个好?

文件防泄密软件哪个好? 在互联网数据时代发展模式下,很多企业的数据都是公司的重要命脉,然后也会有很多人铤而走险,盗取公司机密信息,做违法的事情,然而,保护好公司数据不被泄密成了很多老板头…

Leetcode周赛365补题(3 / 3)

目录 1、2、有序三元组的最大值 - 预处理前后最大值 遍历 (1)预处理前后值遍历(枚举j) (2)枚举k 2、无限数组的最短子数组 - 前缀和 滑动窗口 1、2、有序三元组的最大值 - 预处理前后最大值 遍历 …

linux环境下进程相关概念解释

进程 进程概念PCB(Process control block)进程组织查看进程ps 命令getpid()/getppid()kill -9 pid/ppidfork()为什么fork会有两个返回值?为什么父进程返回子进程的PID,而子进程返回0? linux下的进程状态Z进程孤儿进程 进程优先级查…

新风机小助手-风压变速器

风压变速器是一种用于调节系统中风量和风压的装置,常用于通风系统中。它通过改变进出风口的开度来调整风流的速度和风压。 风压变速器通常由进出风口和可调节的风门组成。风门可以手动或自动调节,控制进出风口的开度,从而改变风量和风压。根据…

数据结构和算法概述

什么是数据结构? 官方解释: 数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及他们之间的关系和操作等相关问题的学科。 大白话: 数据结构就是把数据元素按照一定的关系组织起来的集合,用来组织和存储…

CSC联合培养|公共管理博士赴世界名校瑞士苏黎世联邦理工学院

A同学拟申报CSC联合培养博士项目,要求到专业契合的世界知名高校。最终我们用世界大学排名第7的瑞士苏黎世联邦理工学院邀请函,助其顺利获批CSC,并如期出国。 A同学背景: 申请类型: CSC联合培养博士 工作背景&#xf…

mysql查询最近7天 每天销售额 统计销售额

sql统计每一天的支出数目,支出金额,收入数目,收入金额 finance_type0:收入 finance_type1:支出 部分建表语句: CREATE TABLE finance (finance_id int(11) NOT NULL AUTO_INCREMENT COMMENT ID,finance_u…