深度学习与计算机视觉(一)

news2025/1/12 1:41:19

文章目录

    • 计算机视觉与图像处理的区别
    • 人工神经元
    • 感知机 - 分类任务
    • Sigmoid神经元/对数几率回归
    • 对数损失/交叉熵损失函数
    • 梯度下降法- 极小化对数损失函数
    • 线性神经元/线性回归
      • 均方差损失函数-线性回归常用损失函数
      • 使用梯度下降法训练线性回归模型
      • 线性分类器
        • 多分类器的决策面
      • softmax Regression
      • 训练softmax regression
      • 交叉熵损失
      • 解决参数冗余
      • 训练softmax Classifier
      • 混淆矩阵
      • 合页(铰链)损失

计算机视觉与图像处理的区别

  • 图像处理得到的结果是处理后的图像,图像处理的目的是改善图像的质量

    • 图像增强
    • 图像复原
  • 计算机视觉得到的结果可能是一个符号、一堆数据、一个知识

    • 人脸识别
    • 人脸比对
  • 传统的图像识别的机器学习方法的一般流程包括:

    • 特征提取→数据
    • 数据→机器学习
  • 为什么要提取图像的特征

    • 提取有利于识别的信息,抑制与识别无关的或者对识别有干扰的信息
    • 把不同尺度的图像映射到一个统一的特征空间,便于应用机器学习算法。
  • 机器学习的框架:D数据,A算法,H假设空间,h* H中最好的假设(真实误差最小的假设)
    在这里插入图片描述

  • 概率近似正确
    在这里插入图片描述

人工神经元

在这里插入图片描述

f:响应函数/激活函数一般都是非线性的函数,且一般都单调递增;常用的激活函数包括以下:

在这里插入图片描述
在这里插入图片描述

因为f是单调递增的函数,,如果 w>0,则,说明前一个神经元对后一个神经元有激活的作用;如果w<0 ,说明前一个神经元对后一个神经元有抑制作用。

感知机 - 分类任务

在这里插入图片描述
在这里插入图片描述

  • 感知机算法在线性可分的情况下,一定可以收敛,也就是一定可以找到一个能正确分类所有样本的分类函数
  • 但是同一个样本集,有可能会得到不同的解
    • 不同的初始值,不同的样本处理次序产生的结果不同
    • 不能得到全局最优的解
  • 线性不可分的时候,算法会失败

感知机的算法

在这里插入图片描述

损失函数:不能处处可导

在这里插入图片描述
在这里插入图片描述

解决方法:次梯度

Sigmoid神经元/对数几率回归

只有激活函数的不同,sigmoid处处连续可导,输出的是对数几率
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

对数损失/交叉熵损失函数

损失函数通过比较模型对样本X的预测结果与样本的真实类别y之间的差异,计算损失,差异越大,损失越大,差异越小,损失越小。

在这里插入图片描述
在这里插入图片描述

梯度下降法- 极小化对数损失函数

在这里插入图片描述

线性神经元/线性回归

神经元有两个部分组成:收集信号的过程和激活的过程,收集信号如果是使用线性过程(累加)就是线性神经元。至于收集到的信号能不能激活下一个神经元,要看激活函数的过程,这个过程一般不是线性的。

均方差损失函数-线性回归常用损失函数

在这里插入图片描述

使用梯度下降法训练线性回归模型

是对w,b进行更新

在这里插入图片描述
一元导数与微分的关系: d f / d x = f ′ 一元导数与微分的关系:df/dx=f' 一元导数与微分的关系:df/dx=f
全微分: d F = ( α F / α x ) d x + ( α F / α y ) d y 全微分:dF=(αF/αx) dx+(αF/αy) dy 全微分:dF=(αF/αx)dx+(αF/αy)dy
在这里插入图片描述

线性分类器

α ∗ β = ∣ α ∣ ∗ ∣ β ∣ c o s < α , β > ( α , β 为向量),其中 ∣ β ∣ c o s < α , β > 称为 β 在 α 上的投影 α*β=|α|*|β|cos<α,β>(α,β为向量),其中|β|cos<α,β>称为β在α上的投影 αβ=αβcos<αβ>αβ为向量),其中βcos<αβ>称为βα上的投影
在这里插入图片描述

多分类器的决策面

决策面是可以把各种分类分开的一个面,在三级分类中,决策面应该在超平面的角平分线处划分
在这里插入图片描述

softmax Regression

在这里插入图片描述

  • 这种argmax会把打分最高的结果设为1,其他的结果设为0;但是这种投影的坏处在于只看得到分类,看不到分类的置信为多少,所以引入了softmax Regression( e z 变成正数,正数加和为分母,求概率 e^z变成正数,正数加和为分母,求概率 ez变成正数,正数加和为分母,求概率

在这里插入图片描述
在这里插入图片描述

softmax的决策规则就是:寻找概率最大的作为分类的输出,又因为e函数是单调递增的,所以只要z最大,则概率就会最大。

训练softmax regression

在这里插入图片描述

这里要特别注意,这里计算损失函数的那个概率,是真实样本所对应的概率,不是预测值的那个概率

在这里插入图片描述

训练过程

在这里插入图片描述

交叉熵损失

在这里插入图片描述
在这里插入图片描述

解决参数冗余

可以使用一个正则化项:选择损失函数小且Ω也小的

在这里插入图片描述

训练softmax Classifier

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

混淆矩阵

在这里插入图片描述

对角线上的表示第k个类别的精度,混淆矩阵可以清晰的看到哪一个类别的分类情况较好(精度高),哪一个类别的分类情况不好(精度第),以及具体的分类情况是什么

合页(铰链)损失

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1137517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2016年亚太杯APMCM数学建模大赛A题基于光学信息数据的温度及关键元素含量预测求解全过程文档及程序

2016年亚太杯APMCM数学建模大赛 A题 基于光学信息数据的温度及关键元素含量预测 原题再现 光含有能量&#xff0c;在一定条件下可以转化为热。燃烧是一种常见的现象&#xff0c;既能发光又能发热。光和热通常是同时存在的&#xff0c;一般来说&#xff0c;光强度越高&#xf…

一招教会跨国企业如何解决跨境数据传输的丢包和延迟问题

跨境数据传输是跨国企业的重要需求&#xff0c;无论是进行远程协作、视频会议、在线教育、电子商务、游戏娱乐等业务&#xff0c;都需要实时地在不同国家和地区之间传输数据。然而&#xff0c;跨境数据传输也面临着很多挑战&#xff0c;如网络延迟、丢包、不稳定等&#xff0c;…

I/O软件层次结构(用户层软件,设备独立性软件,设备驱动程序,中断处理程序,硬件)

文章目录 1.用户层软件2.设备独立性软件1.主要实现的功能2.逻辑设备表&#xff08;LUT&#xff09; 3.设备驱动程序4.中断处理程序2.中断处理程序的处理流程 4.硬件 1.用户层软件 用户层软件实现了与用户交互的接口&#xff0c;用户可直接使用该层提供的、与I/O操作相关的库函数…

Go 语言代码断行规则详解

一、Go代码断行概念 代码断行&#xff0c;或称为代码换行&#xff0c;是编程中一个很常见但却经常被忽视的细节。它涉及到如何在代码行结束时添加换行符&#xff0c;使代码展示为多行结构。代码断行不仅影响代码的可读性和美观性&#xff0c;还可能与编程语言的语法、编译器行…

Framework -- 系统架构

一、前言 framework的学习&#xff0c;需要掌握到什么程度&#xff1f; App 的启动流程&#xff1a;整体的过程&#xff0c;具体到某些类在整个流程中所起的作用&#xff1b;组件的设计模式&#xff0c;核心设计思想&#xff1b;需要知晓目前已知的问题&#xff0c;以及解决方…

定档11月2日,YashanDB 2023年度发布会完整议程公布

数据库作为支撑核心业务的关键技术&#xff0c;对数字经济的发展有着重要的支撑作用&#xff0c;随着云计算、AI等技术的迅猛发展和数据量的爆发式增长&#xff0c;推动着数据库技术的加速创新。 为了应对用户日益复杂的数据管理需求&#xff0c;赋能行业国产化建设和数字化转型…

python 线程池/AIO(异步非阻塞)调用接口示例

分别测试了 多线程、线程池、aio 等模式 线程受CPU调度限制&#xff0c;大请求量下 AIO 效率最高&#xff0c;详见代码 注释中有详细说明&#xff0c;main 方法中是程序入口 """ python 各种方式发起 http 请求对比 参考&#xff1a; https://plainenglish.io…

“第五十一天”

无符号整数&#xff1a; 计算机硬件在进行无符号整数的加法时&#xff0c;从最低位开始&#xff0c;按位相加&#xff0c;并往更高位进位。 当进行减法时&#xff0c;被减数不变&#xff0c;减数全部按位取反&#xff0c;末位加一&#xff08;将一个正数变负&#xff0c;或者…

关键词搜索淘宝商品数据接口(标题|主图|SKU|价格|优惠价|掌柜昵称|店铺链接|店铺所在地)

关键词搜索淘宝商品数据接口是可以通过API的方式来进行调用。这些接口可以获取到商品列表的标题、SKU ID、价格、优惠价、收藏数、月销售量等数据。 通过这些接口&#xff0c;可以实现关键词搜索淘宝商品列表的功能&#xff0c;也可以获取到商品详情页的数据信息&#xff0c;适…

微信自动通过好友请求是怎么设置的?

微信是一款必不可少的社交工具&#xff0c;尤其对于需要使用微信进行业务沟通和促进成交的人来说。 业务繁忙时可能每天有几十上百个微信好友申请&#xff0c;这时候如果手动“通过验证”不仅会工作质量和效率&#xff0c;有可能由于通过不及时而导致客户流失。 方式一 自动通…

leetCode 76. 最小覆盖子串 + 滑动窗口

76. 最小覆盖子串 - 力扣&#xff08;LeetCode&#xff09; 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串&#xff0c;则返回空字符串 "" 注意&#xff1a; 对于 t 中重复字符&#xff0c;我们寻…

D71X-16Q手柄蝶阀型号解析

D71X-16Q型号字母含义解析 D71X-16Q是德特森阀门常用的手柄蝶阀型号字母分别代表的意思是: D——代表阀门类型《蝶阀》 7——代表连接方式《对夹》 1——代表结构形式《中线》 X——代表阀座材质《橡胶》 -代表分隔键 16——代表公称压力《1.6MPA》 Q——代表阀体材料《…

FPGA设计时序约束七、设置时钟不确定约束

一、背景 在之前的时序分析中&#xff0c;通常是假定时钟是稳定理想的&#xff0c;即设置主时钟周期后按照周期精确的进行边沿跳动。在实际中&#xff0c;时钟是非理想存在较多不确定的影响&#xff0c;存在时延和波形的变化&#xff0c;要准确分析时序也需将其考虑进来&#x…

2023深耕kotlin,谈谈前景

为什么学习kotlin&#xff1f; Kotlin 早就已经是 Google 官方推荐的开发语言了&#xff0c;而且 Android 新的 Compose 框架只支持 Kotlin &#xff0c;在 Google 那里&#xff0c;Android开发中 Java 其实已经被淘汰了。Java 和 Kotlin 虽然都属于高级语言&#xff0c;但是 …

利用nicegui开发ai工具示例

from fastapi import FastAPI import uvicorn from nicegui import uiclass PipRequirement:def __init__(self):ui.label("依赖安装与依赖展示")class BasicSettings:def __init__(self):self.project_select ui.select(["test"], label"项目选择&q…

驱动获取设备树节点信息

mycdev.c #include <linux/init.h> #include <linux/module.h> #include <linux/of.h>struct device_node *dnode; //解析得到的设备树节点对象指针 struct property *pr; unsigned int lenth; static int __init mycdev_init(void) {//解析设备树节点信息d…

Hafnium安全分区管理器和示例参考软件栈

安全之安全(security)博客目录导读 目录 一、安全分区管理器 1、术语 2、对旧平台的支持 二、示例参考软件栈 一、安全分区管理器 安全分区管理器的三种实现在TF-A代码库并存&#xff1a; 1.基于FF-A规范的S-EL2 SPMC&#xff08;SPM Core&#xff09;&#xff0c;使能安全…

C++ 模板和泛型编程详解

C中的模板和泛型编程是非常重要的概念。模板是一种将数据类型作为参数的通用程序设计方法。它们允许开发人员编写可以处理各种数据类型的代码&#xff0c;而无需为每种数据类型编写不同的代码。下面介绍了一些关于C中模板和泛型编程的重要知识点 模板的定义 模板是一种通用程序…

论坛议程 | COSCon'23 开源治理(G)

众多开源爱好者翘首期盼的开源盛会&#xff1a;第八届中国开源年会&#xff08;COSCon23&#xff09;将于 10月28-29日在四川成都市高新区菁蓉汇举办。本次大会的主题是&#xff1a;“开源&#xff1a;川流不息、山海相映”&#xff01;各位新老朋友们&#xff0c;欢迎到成都&a…

第十五章:L2JMobius学习 – 刷新NPC和对话

首先&#xff0c;我们介绍一下城镇里面的传送师NPC的刷新和对话。 传送师对应的类是L2TeleporterInstance&#xff0c;它继承L2FolkInstance&#xff0c;再继承L2NpcInstance。 我们要处理的是“单击/双击”传送师的业务逻辑&#xff0c;对应的是Action数据包。这个数据包具有…