【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例(4)计算机视觉实际应用的特点

news2024/9/23 9:29:46

今天考试通过腾讯云人工智能从业者TCA级别的认证了!

还是很开心的,也看不到什么更好的方向,把一切能利用的时间用来学习,总是对的。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

这个号码真好,88868909,我喜欢。

今天来总结计算机视觉实际应用的特点。

机器学习和深度学习,总算是搞明白了。今天考试,有好几个考点,都和这个有关系。

我理解的机器学习和深度学习的区别和联系

  • 机器学习包含了深度学习;
  • 深度学习主要是神经网络技术,这是Hinton这个大神,也就是人工智能之父,40年坚持的结果;
  • 机器学习主要是特征工程的存在,有标注,也有标签,深度学习也需要数据标注,但是基本不需要做特征工程,也就是人工进行数据预处理、特征抽取、特征选择、特征这些工作;
  • 深度学习只关注端到端,就是输入到输出的过程。其中也有多隐层神经网络等,在例子中的前馈神经网络,是最简单的神经网络模型;
  • 机器学习由于有人的参与,所以可解释性很强,很多时候其实是为了特定任务而去做的,普适性不是很强,而深度学习,自己就能学习;
  • 比如在图片分类中,机器学习要对图片进行特征工程,就是打标签,找出汽车车身的特征,而深度学习,直接用卷积算法就可以,滑动窗口,整个图片使用同一个权重,得到特征值,通过多层神经网络,学习哪个是汽车;
  • 所以说机器学习是人工来提取特征,深度学习是从数据中创建新的特征;
  • 机器学习要把复杂的工作,拆分为小的任务,逐个攻克;深度学习只关注端到端;
  • 机器学习可以使用少量的数据,就能预测,而深度学习不行;
  • 机器学习用低性能的计算机就能计算,而深度学习不行;

大概就是这样。

这是整个人工智能课程的核心。

当然,现在大家都普遍关心的,是sora,大模型LLM等,这肯定更有魅力的应用方向。大模型的出现,让人工智能真的是走向了新的高峰。

有人说,之前的人工智能,都是针对特定任务的,没有普适性。从大模型的出现来看,AGI也许已经在某个实验室里面实现了。

AGI是Artificial General Intelligence的首字母缩写,意为人工通用智能,也称为强人工智能。它指的是一种具有类似于人类全面智能的人工智能系统,可以处理不同领域的任务和问题,包括学习、推理、理解语言、感知环境、创造性思考等多种能力。与只能处理特定任务的狭窄人工智能(Narrow AI)不同,AGI旨在实现人类智能的全面模拟,并可以在不同场景和任务中表现出与人类相似的智能水平。

AGI的实现需要融合多个领域的知识和技术,包括机器学习、自然语言处理、计算机视觉、机器人技术等,同时也需要解决许多挑战和难题,如理解自然语言、掌握常识知识、具备有效的推理能力、能够感知和适应不同的环境等。

虽然AGI的实现仍面临着许多挑战和风险,如数据隐私、伦理道德等问题,但其对人类社会的影响和意义是巨大的。AGI可以帮助我们解决许多重大问题,如环境保护、医疗保健、安全保障等,同时也可以在各个领域中充当人类的助手、合作伙伴甚至是导师的角色,推动人类社会的进步和发展。

因此,AGI是当前人工智能领域的一个重要研究方向,也是未来人工智能发展的一个重要趋势。

言归正传,我们今天该学习机器视觉的一些普通特性了。

看,就是这些核心的内容。

很多朋友又要感觉没意思了,觉得没有关键技术名词,没有英文对照,没有示例代码等等。

其实,这些理念,是更重要的东西。

当前我们的任务,是要给玩具小车,加上自动识别标识牌的能力,我们暂且不管,边缘端的情况,我们来看这些要注意的事项。

  • 样本具象化。图像是具体表现形式,除了主体外,还有大量的信息,如背景,光照等。
  • 算法光线敏感性。侧光,面向光,背光,强光,暗光,都有影响,如果样本没有这些光线的图片,效果会欠佳。
  • 理解硬件条件可能造成的图片效果偏差。带来色差、模糊、角度变化,样本如果没有这些资料,效果会欠佳。
  • 客户理解的偏差。不理解光线影响,不能清晰的表达述求,都在需求梳理时摸清,否则影响交付。

前面都好说,有经验的项目人员,就能知道怎么来理解了。

最后的客户理解偏差,反而是我在实践中,感觉最头疼的。

客户认为,这不是很简单的事吗!

这要很久吗?!

这那个什么什么公司,不是早就做出来了吗?我们只是要做个一样的,甚至还更简答的而已!

好吧,客户不知道,除了识别这些标志,我们还要看,你这个场地,有什么特点,光线,硬件条件等等,包括这些小车搭载的摄像机,是多少分辨率!

延伸学习:


在计算机视觉的实际应用中,有许多关键的注意事项和经验,这些可以影响算法的准确性和效率。以下是一些主要的考虑因素:

  1. 图像质量:高质量的图像对于计算机视觉算法至关重要。图像的清晰度、分辨率和噪声水平都会影响算法的性能。因此,在实际应用中,需要确保使用的图像采集设备能够提供高质量的图像,或者采用图像增强技术来改善图像质量。
  2. 光照条件:光照条件是影响计算机视觉算法性能的另一个重要因素。不同的光照条件(如亮度、颜色温度、方向等)会对图像的外观产生显著影响,从而影响算法的准确性。为了解决这个问题,可以采用背景光照补偿技术、阴影去除技术等,以提升计算机视觉系统的鲁棒性。同时,在实际应用中,应尽量选择光线充足、均匀的环境,避免强光和暗光交替的情况出现。
  3. 数据集偏差:训练数据集的选择和准备对于计算机视觉算法的性能至关重要。如果训练数据集中存在偏差,比如样本不平衡、类别不均衡等,可能导致算法的泛化能力下降。为了解决这个问题,可以采用数据集采样均衡化、数据增强等技术,以改善模型的性能。同时,应注意数据的质量和多样性,确保数据集具有足够的标签和多样的样本。
  4. 镜头选择:在计算机视觉应用中,镜头的选择也会影响图像的质量和算法的准确性。不同的镜头有不同的焦距、光圈和景深等特性,这些特性会影响图像的清晰度和细节表现。因此,在实际应用中,应根据具体的需求选择合适的镜头。
  5. 避免畸变:在定位及高精度测量的系统中,畸变是一个需要特别注意的问题。畸变会导致图像中的物体形状发生扭曲,从而影响算法的准确性。为了解决这个问题,可以采用畸变校正技术,或者在系统标定时使用远心镜头等特殊镜头来减小畸变的影响。
  6. 恰当的照明与曝光:照明和曝光是影响图像质量的关键因素之一。如果照明不足或曝光过度,图像将不能提供足够的反差和细节信息,这将严重影响算法的准确性。因此,在实际应用中,需要选择适合的灯源和曝光设置,以确保图像具有足够的反差和细节信息。同时,还应注意系统周围环境的影响,避免其他光源对图像产生干扰。
  7. 算法选择与调优:对于不同的视觉任务,可能有多种不同的算法可供选择。在实际应用中,应根据任务的要求和数据集的特点选择合适的算法,并进行必要的调优。这包括选择合适的网络结构、调整超参数、使用正则化技术等手段来提高算法的准确性和效率。
  8. 实时性与性能平衡:在计算机视觉应用中,实时性和性能之间往往存在一定的权衡关系。为了提高算法的实时性,可能需要牺牲一部分性能;反之,为了提高性能,可能需要增加计算复杂度和时间成本。因此,在实际应用中,需要根据具体的需求和场景来平衡实时性和性能之间的关系。

总之,在计算机视觉的实际应用中,需要考虑多个方面的因素来确保算法的准确性和效率。通过注意以上提到的注意事项和经验,可以更好地应用计算机视觉技术来解决实际问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1467982.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java 模糊查询不用like,还可以用什么实现

在电商项目中,如果模糊查询用like的话,会给服务器带来很大的压力,导致服务器崩溃这都是有可能的,最开始做电商搜索框的时候,告诉我不可以用like,这对我来说,简直就是在为难我啊,可能…

Opencv实战(2)绘图与图像操作

Opencv实战(2)绘图与图像操作 指路前文:Opencv实战(1)读取与像素操作 三、基本绘图 文章目录 Opencv实战(2)绘图与图像操作三、基本绘图(1).line(2).rectangle(3).circle 四、图像处理(1).颜色空间1.意义2.cvtColor()3.inRange()4.适应光线 (2).形态操作1.腐蚀2.膨…

[VulnHub靶机渗透] FourandSix2.01

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收藏 …

解决RabbitMQ管理页面异常/不正确的问题

正确的页面:有Channels、Exchanges等 异常/不正确的页面: 问题原因 我的RabbitMQ是用docker安装的,应该不会是安装的环境有问题。 而且MQ的服务确实是启动了,后端能正常使用,并且管理界面的登录页面也是能正常登录的&…

【软件测试】定位前后端bug总结+Web/APP测试分析

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、Web测试中简单…

【蓝桥备赛】字串简写

字串简写 数据范围 字符串的长度为5*10的五次方,on方时间复杂度会很大。 才用动态规划的思想,dp[i]以i开头的的可能性,因为长度必须大于等于k,当i小于k的时候,如果等于第一个字符,s1时,dp[…

中兴通讯携吉林移动迈向5G-A新阶段,完成3CC技术应用

日前,中兴通讯携手中国移动吉林移动分公司,在5G-A领域取得新突破。具体来说,双方基于MTK芯片M80终端,完成了5G-A三载波聚合试点,实测下行速率达到理论峰值4.25Gbps,相比2.6G单载波速率提升2.5倍。如此成绩&…

C++多继承之菱形继承原理及解决方法

目录 1.单继承和多继承 2.菱形继承 3.虚继承解决菱形继承 3.1使用方法 3.2虚继承原理 4.继承和组合 1.单继承和多继承 一个子类只有一个父类称为单继承 一个子类有多个父类称为多继承 2.菱形继承 菱形继承是多继承的一种复杂的情况 这里会出现一个问题,Assi…

Axtue使用笔记

1、有三种方式可以设置元件顺序 第一种是鼠标右键点击顺序,选择调整操作置顶、置底、上移一层、下移一层; 第二种是在顶部工具栏中,选择调整操作置顶、置底、上移一层、下移一层; 第三种是使用快捷键操作 Windows:置顶&#xff1a…

持续集成,持续交付和持续部署的概念,以及GitLab CI / CD的介绍

引言:上一期我们部署好了gitlab极狐网页版,今天我们介绍一下GitLabCI / CD 目录 一、为什么要 CI / CD 方法 1、持续集成 2、持续交付 3、持续部署 二、GitLab CI / CD简介 三、GitLab CI / CD 的工作原理 4、基本CI / CD工作流程 5、首次设置 …

如何在Python中创建动态图形?

动态图形是使可视化更具吸引力和用户吸引力的好方法。它帮助我们以有意义的方式展示数据可视化。Python帮助我们使用现有强大的Python库创建动态图形可视化。Matplotlib是一个非常流行的数据可视化库,通常用于数据的图形表示,也用于使用内置函数的动态图…

springboot212球队训练信息管理系统

球队训练信息管理系统设计与实现 摘 要 传统办法管理信息首先需要花费的时间比较多,其次数据出错率比较高,而且对错误的数据进行更改也比较困难,最后,检索数据费事费力。因此,在计算机上安装球队训练信息管理系统软件…

Bert-VITS-2 效果挺好的声音克隆工具

持中日英三语训练和推理。内置干声分离,切割和标注工具,开箱即用。请点下载量右边的符号查看镜像所对应的具体版本号。 教程地址: sjj​​​​​​​CodeWithGPU | 能复现才是好算法CodeWithGPU | GitHub AI算法复现社区,能复现…

2024.02.24 跑步打卡第 6 天

能受天磨真铁汉,不遭人嫉是庸才 2024.02.24 跑步打卡第 6 天

【Vuforia+Unity】AR07-实现识别条码、二维码内容功能(Barcode Scanner)

Barcode Scanner in Unity | Vuforia Library官方教程,写的很详细,本教程主要参考对象! 主要实现扫描生活中常见的二维码,然后弹出二维码链接,当然我们也可以再次回调自定义函数,弹出数字内容,AR内容效果! 支持的二维码: 局限性 条码扫描组件还定义检测和跟踪的条形…

Docker Container(容器)

"在哪里走散,你都会找到我~" Docker 容器 什么是容器? 通俗来讲,容器是镜像运行的实体。我们对于镜像的认知是,“存储在磁盘上的只读文件”。当我们启动一个容器的本质,就是启动一个进程,即容器…

K线实战分析系列之五:刺透形态——多方反攻信号

K线实战分析系列之五:刺透形态——多方反攻信号 一、刺透形态二、类似刺透形态三、刺透形态的总结 一、刺透形态 阴线在前,阳线在后显示市场曾经跌到了低位,但是在盘中又将价格收回,并且多方收复了前一天大部分的失地 二、类似刺…

计算机设计大赛 深度学习卷积神经网络的花卉识别

文章目录 0 前言1 项目背景2 花卉识别的基本原理3 算法实现3.1 预处理3.2 特征提取和选择3.3 分类器设计和决策3.4 卷积神经网络基本原理 4 算法实现4.1 花卉图像数据4.2 模块组成 5 项目执行结果6 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 基…

ES通用查询页面使用说明

前言:ES语法比较复杂,需要专门的学习,而且查询工具不太友好, 对公司运维人员使用有点困难,所以花了个时间做了一个页面,方便运维人员使用,如下。 也不难,有兴趣的朋友可以私聊发源码。 开发帮助-ES数据查询 搜索 输入要查看的文档索引,文档类型后点【查询】即可 搜…

MySQL知识点总结(五)——锁

MySQL知识点总结(五)——锁 锁分类表锁 & 行锁如何添加表锁?如何添加行锁? 读锁 & 写锁行锁 & 间隙锁(gap lock)& 临键锁(next-key lock) 加锁机制分析可重复读隔离…