计算机视觉与深度学习-卷积神经网络-纹理表示卷积神经网络-纹理表示-[北邮鲁鹏]

news2024/11/23 9:23:28

目录标题

  • 参考文章
  • 纹理定义
  • 纹理的分类
    • 规则纹理
    • 随机纹理
  • 纹理的表示方法
    • 基于卷积核组
      • 思路
      • 什么卷积核组
        • 卷积核类型(边缘、条形、点状)
        • 卷积核尺度(3~6个尺度)
        • 卷积核的方向
        • 卷积核组的设计
      • 表示步骤
        • 步骤一:设计卷积核组。
        • 步骤二:利用卷积核组对图像进行卷积操作获得对应的特征响应图组。
        • 步骤三:利用特征响应图的某种统计信息来表示图像中的纹理。
      • 总结
  • 纹理表示注意事项
  • 纹理表示与卷积神经网络的联系

参考文章

计算机视觉与深度学习-05-纹理表示&卷积神经网络-北邮鲁鹏老师课程笔记

纹理定义

纹理是指物体表面的视觉和触觉特征,它描述了物体表面的细节、图案和结构。
计算机图形学中的纹理既包括通常意义上物体表面的纹理即使物体表面呈现凹凸不平的沟纹,同时也包括在物体的光滑表面上的彩色图案,通常我们更多地称之为花纹。

在这里插入图片描述
纹理是由于物体表面的物理属性的多样性而造成的,物理属性不同表示某个特定表面特征的灰度或者颜色信息不同,不同的物理表面会产生不同的纹理图像,因而纹理作为图像的一个极为重要的属性,在计算机视觉和图像处理中占有举足轻重的地位。

纹理是图像中特征值强度的某种局部重复模式的宏观表现。然而,对于自然纹理图像而言这种重复模式往往是近似的和复杂的,难以用语言描述,而人类对纹理的感受多是与心理效果相结合的,因此,迄今都没有一个对纹理的正式的、广泛认可的和一致的定义。

Hawkins曾经对纹理给出了一个比较详细的描述,他认为纹理有三个主要的标志:

  1. 某种局部的序列性在比该序列更大的区域内不断重复
  2. 序列是由基本元素非随机排列组成的
  3. 各部分大致是均匀的统体,在纹理区域内的任何地方都有大致相同的结构尺

纹理的分类

规则纹理

在这里插入图片描述
通常都是人造

随机纹理

在这里插入图片描述
自然界通常都是随机纹理

纹理的表示方法

基于卷积核组

思路

  1. 利用卷积核组提取图像中的纹理基
  2. 利用基元的统计信息来表示图像中的纹理

什么卷积核组

卷积核组又称为纹理滤波器组。

卷积核类型(边缘、条形、点状)

  • 边缘:高斯一阶偏导核。例:黑|白,白|黑。
  • 条形:高斯二阶偏导核。例:白|黑|白,黑|白|黑。
  • 点状:。例:周围白中间黑,周围黑中间白。

在这里插入图片描述

卷积核尺度(3~6个尺度)

  • 大尺度,提取粗粒度边。
  • 小尺度,提取细粒度边。

卷积核的方向

在这里插入图片描述
前6个卷积核检测是否存在边缘及边缘的方向。
第1个卷积核检测图像中是否有x方向的边缘。(高斯卷积核对y求导)
第4个卷积核检测图像中是否有y方向的边缘。(高斯卷积核对x求导)
第7个卷积核检测图像中是否有斑状基元。

第1个卷积核检测图像中是否有x方向的边缘。(高斯卷积核对y求导)
在这里插入图片描述
第7个卷积核检测图像中是否有斑状基元
在这里插入图片描述

卷积核组的设计

在这里插入图片描述
48个卷积核组
在这里插入图片描述

表示步骤

步骤一:设计卷积核组。

在这里插入图片描述

步骤二:利用卷积核组对图像进行卷积操作获得对应的特征响应图组。

在这里插入图片描述

步骤三:利用特征响应图的某种统计信息来表示图像中的纹理。

方式一 (含基元位置信息)
在这里插入图片描述
假设图片是 100 * 100,使用上述含7个卷积核的卷积核组,则该图片每一个像素点表示为 r i = [ r i 1 , r i 2 , … , r i 7 ] r_i = [r_{i1},r_{i2},\dots,r_{i 7}] ri=[ri1,ri2,,ri7] r i m a x = m a x { r i 1 , r i 2 , … , r i 7 } r_{imax} = max\{{r_{i1},r_{i2},\dots,r_{i 7}}\} rimax=max{ri1,ri2,,ri7}。则 r i m a x r_{imax} rimax对应的特征响应图即为该像素点的特征。

其中 r i r_i ri的维度是 10000 * 1, [ r i 1 , r i 2 , … , r i 7 ] [r_{i1},r_{i2},\dots,r_{i7}] [ri1,ri2,,ri7]的维度是 10000 * 7,经过变换后 [ r i 1 , r i 2 , … , r i 7 ] [r_{i1},r_{i2},\dots,r_{i7}] [ri1,ri2,,ri7]的维度为 70000 * 1。

该表示方式的缺点:70000维太复杂。

方式二 (忽略基元位置信息)

纹理分类任务中,基元的位置对纹理分类没有影响。

只关注出现了哪种基元对应的纹理以及基元出现的频率,即用特征响应图的平均值表示图像。
在这里插入图片描述

假设图片是100 * 100,使用上述含7个卷积核的卷积核组,则该图片每一个像素点基元平均值表示为 r ˉ = [ r 1 ˉ , r ˉ 2 , … , r ˉ 7 ] \bar r = [ \bar {r_{1}}, \bar r_{2},\dots, \bar r_{ 7}] rˉ=[r1ˉ,rˉ2,,rˉ7] r ˉ i m a x = m a x { r ˉ 1 , r ˉ 2 , … , r ˉ 7 } \bar r_{imax} = max\{{\bar r_{1}, \bar r_{2},\dots, \bar r_{7}}\} rˉimax=max{rˉ1,rˉ2,,rˉ7},则 r i m a x r_{imax} rimax对应的特征响应图即为该像素点的特征。

其中 r ˉ i \bar r_i rˉi为第 i 个特征响应图的平均值,其维度是 1 * 1, r ˉ j \bar r_j rˉj的维度是 1 * 7,经过变换后 r ˉ j \bar r_j rˉj的维度为 7 * 1。

举例表示
在这里插入图片描述
纹理表示A:r4 比较大,表示y方向的纹理比较多。
纹理表示B:r5 比较大,表示y=x方向的纹理比较多。
纹理表示C:r7 比较大,表示斑点纹理比较多。

总结

  1. 设计卷积核组;
  2. 利用卷积核组对图像进行卷积操作获得对应的特征响应图组;
  3. 利用特征响应图的某种统计信息来表示图像中的纹理。

纹理表示注意事项

在这里插入图片描述
r ˉ = [ r ˉ 1 , r ˉ 2 , r ˉ 3 , r ˉ 4 , . . . , r ˉ 46 , r ˉ 47 , r ˉ 48 ] \bar r = [\bar r_1,\bar r_2,\bar r_3,\bar r_4,... ,\bar r_{46},\bar r_{47}, \bar r_{48}] rˉ=[rˉ1,rˉ2,rˉ3,rˉ4,...,rˉ46,rˉ47,rˉ48]中最大值大概率只有一个,因为一张图像包含一个卷积核组所表示的纹理的概率大,包含多个卷积核组所表示纹理的概率很小,所以这个48维向量是稀疏向量。

纹理表示与卷积神经网络的联系

从纹理表示中的卷积核组理解卷积神经网络的卷积层,神经网络中卷积核可能比上例中纹理表示的卷积核更复杂。神经网络的卷积层可以看做上例中纹理表示卷积核组的扩展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1024773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试/测试开发丨利用ChatGPT自动生成测试用例思维导图

点此获取更多相关资料 简介 思维导图是一种用图形方式表示思维和概念之间关系的工具: 有些公司会使用思维导图编写测试用例,这样做的优点是: 1.可视化和结构化。 2.易于理解,提高效率。 而 ChatGPT 是无法直接生成 xmind 格式…

Git学习笔记10

代码更新方法: 蓝绿部署: 蓝绿部署,英文名:Blue Green Deployment,是一种可以保证系统在不间断提供服务的情况下上线代码的部署方式。 如何保证系统不间断提供服务呢? 蓝绿部署的模型中包含两套集群。 …

ElementPlus·表单验证

表单验证作用&#xff1a;省去一些错误的请求提交&#xff0c;节省后端接口压力。简单配置、自定义配置&#xff0c;最后进行统一校验工作。 如何校验 及 校验步骤&#xff1a; 简单配置 <script setup> // 表单对象 const form ref({对象: 值 })// 规则对象 const ru…

21. 概率与统计 - 数学期望、统计描述分布

文章目录 数学期望方差标准差协方差二项分布高斯分布中心极限定理泊松分布Hi, 你好。我是茶桁。 在上一节中,我们最后有谈到随机变量。在概率论几统计学中,描述一个随机变量的离散程度的有方差、标准差等等。那么在这节课中,我们就来好好看看这些概念。 不过在这之前呢,我…

【音视频】FLV封装格式

基本概念 文件头(Header)文件体(Body) flv文件头 主要是看signture和typeflags flv文件体 重点&#xff1a;Tag包数据 Tag结构详细说明 注意&#xff1a; 每个Tag的头字段DataSize只是该Tag下data部分的大小&#xff0c;不包括Tag的header部分的大小 音频 AudioTag Data 所在…

若依+lodop+jasperreports+ireport 设计打印票据格式(二)

若依lodopjasperreportsireport 设计打印票据格式&#xff08;二&#xff09; 使用Field绑定Java传入数据 设计页表页数和当前页号 ![在这里插入图片描述](https://img-blog.csdnimg.cn/7091542bd5954845b8fcf39d71d4c9e4.png#pic_cente![在这里插入图片描述](https://img-bl…

[Vue] 绑定下拉菜单

写在前面 同学们&#xff0c;今天的天气很是不错&#xff0c;我们之前进行了复选框的绑定&#xff0c;这次来看看下拉菜单的绑定吧&#xff0c;因为要赶这个创作进度&#xff0c;真的只有再水一篇文章了。大家就当是饭后甜点看看就行。 苏子云 荷尽已无擎雨盖&#xff0c;菊残…

红海云荣膺「2023智享会人力资源技术供应商价值大奖」

9月19日&#xff0c;由中国高端人力资源会员组织智享会&#xff08;HREC&#xff09;主办的“2023人力资源技术供应商价值大奖”颁奖典礼隆重举行&#xff0c;红海云凭借卓越的技术实力与品牌口碑荣膺“2023 HCM系统-本地部署HR臻选供应商”。 智享会“价值大奖”系列评选被称…

基于STM32+华为云IOT设计的智能垃圾桶

一、项目介绍 在商业街、小吃街和景区等人流密集的场所&#xff0c;垃圾桶的及时清理对于提供良好的游客体验至关重要。然而&#xff0c;传统的垃圾桶清理方式通常是定时或定期进行&#xff0c;无法根据实际情况进行及时响应&#xff0c;导致垃圾桶溢满&#xff0c;影响环境卫…

钉钉stream机器人-实操详细教程

支持事件订阅、机器人收消息、卡片回调等功能 优点&#xff1a; 配置简单&#xff0c;不依赖也不需要暴露公网IP&#xff0c;无需向公网开放端口 github官方链接&#xff1a;GitHub - open-dingtalk/dingtalk-stream-sdk-python: Python SDK for DingTalk Stream Mode API, Co…

低噪声 256 细分微步进电机驱动MS35774/MS35774A(汽车应用级别)

MS35774/MS35774A 是一款高精度、低噪声的两相步进 电机驱动芯片&#xff0c;芯片内置功率 MOSFET&#xff0c;长时间工作的平均电 流可以达到 1.4A&#xff0c;峰值电流 2A。芯片集成了过温保护、欠压 保护、过流保护、短地保护、短电源保护功能。 主要特点 ◼ 2 相步进电机…

excel subtotal 函数(分类汇总)

函数说明 返回列表中的分类汇总。 语法 SUBTOTAL(function_num,ref1,[ref2],...) SUBTOTAL 函数语法具有以下参数&#xff1a; Function_num 必需。 数字 1-11 或 101-111&#xff0c;用于指定要为分类汇总使用的函数。 如果使用 1-11&#xff0c;将包括手动隐藏的行&…

glTF模型骨骼动画

推荐&#xff1a;使用 NSDT场景编辑器快速搭建3D应用场景 本文详细演示了风车动画的制作过程&#xff1a; 当然&#xff0c;这非常容易硬编码&#xff08;有两个对象&#xff0c;一个静态的&#xff0c;一个旋转的&#xff09;。但是&#xff0c;我计划稍后添加更多动画&#…

GIF动图怎么变成jpg动图?一键分解GIF动画

GIF格式图片怎么转换成jpg格式图片&#xff1f;在日常生活中jpg、png转GIF格式非常的常见&#xff0c;那么gif转换成jpg格式应该怎么操作呢&#xff1f;很简单&#xff0c;给大家分享一款gif动态图片制作&#xff08;https://www.gif.cn/giffenjie&#xff09;工具&#xff0c;…

51单片机项目(12)——基于51单片机的智能台灯设计

本次设计的功能如下&#xff1a; 首先使用PCF8591芯片&#xff0c;实现了AD DA转换&#xff0c;AD采集的是光敏电阻的信息&#xff0c;光照强度越强&#xff0c;电压越小&#xff0c;AD采集到的数值越小。同时将AD采集的数字量作为DA输出时的输入量&#xff0c;模拟输出端接了…

技术对比:Flutter vs. 传统桌面应用开发框架

在移动应用开发领域&#xff0c;Flutter已经赢得了广泛的认可和采用&#xff0c;成为了跨平台移动应用开发的瑞士军刀。然而&#xff0c;Flutter的魅力并不仅限于移动平台&#xff0c;它还可以用于开发桌面应用程序&#xff0c;为开发人员提供了一种全新的选择。本文将深入探讨…

react 路由的使用

react-router-dom 专注于web网页开发 下载依赖&#xff0c;这里使用的版本是5 npm install react-router-dom5 1.路由的基本使用,点击左侧菜单进行高亮&#xff08;进行高亮要使用NavLink&#xff0c;使用了NavLink,会根据 activeClassName"active"找到active的cl…

Vue基础语法的进阶,事件处理器,自定义组件及组件通信

目录 一、事件处理器 1. 概述 2. 实例 二、语法整合 1. 作用 2. 实例 三、自定义组件 1. 概述 2. 实例 四、组件通信 ( 1 ) 讲述 ( 2 ) 父传子 ( 3 ) 子传父 学习后的收获 一、事件处理器 1. 概述 在Vue中&#xff0c;事件处理器是用来处理DOM事件的方法。它…

ubuntu20.04 安装 pyconcorde

这个包似乎对网络环境要求挺高的&#xff0c;我们直接弄个 射线A型号 的飞机 直接使用 pip install pyconcorde 安装&#xff0c;发现在使用里面的包时会报奇怪的错误&#xff0c;于是决定寻找 github 上的 pyconcorde 源码&#xff0c;看文档进行安装 github 地址&#xff1…

msvcp140.dll重新安装的解决方法是什么?(最新方法)

msvcp140.dll 是 Microsoft Visual C Redistributable 的一个动态链接库文件&#xff0c;它包含了 C 运行时库的一些函数和类&#xff0c;对于许多应用程序和游戏来说都是必需的。如果您的系统中缺失了这个文件&#xff0c;可能会导致程序无法正常运行。下面我们将分享修复 msv…