综述:图像分割

news2024/11/28 11:56:57

综述

图像分割(segmentation、cut)指的是将数字图像划分成多个图像子区域的过程。

在实际场景中具有诸多重要应用

在广义的图像分割中,传统方法和深度方法对于分割有不同的定义。

  • 传统方法:对于图像进行区域划分,核心问题在于:区域间差异性、区域内相似性。本质上属于一个聚类问题

  • 深度方法:对于图像进行像素级分类,核心问题在于:逐像素分类,本质上是一个分类问题

实际上,在深度方法中,对于语义分割又有更加细分的问题定义

  • 语义分割:将前景与后景区分开来

  • 实例分割:将不同的物体分类分割

本课程会简要介绍传统的图像分割算法,更多注重于介绍语义分割问题。

图像分割的传统方法

在传统方法时代,主要是基于初等图像特征对图像的像素进行划分,本质上,是对一簇像素进行合并的过程。

主要的思路包括:

  • 阈值法:根据不同的像素值等级,划分出不同的方法。代表性方法为直方图法

  • 边缘法:根据梯度进行区域划分。

  • 区域法:以像素为起点,不断合并周围像素成为更大的区域。代表性方法: 区域生长,分水岭算法

  • 轮廓法:设定一个初始轮廓,定义函数值对其进行优化逼近物体的真实轮廓。

  • 图论法:将区域视为一个整体,不断进行切割。直到切割不动了(满足阈值)。

区域法

区域生长算法

  1. 选择一个像素作为中心点;
  2. 从种子向外扩张,将满足条件的点逐渐地加入种子集合中;
  3. 执行第二步,直到没有新的点加入集合。

分水岭算法

  1. 找到最小灰度值像素点,让threshold从最小值开始增长
  2. 增长过程中,如果邻阈像素没有被分类,则加入像素值
  3. 上述过程直到在边界相遇,从而对像素进行分区

图论法

每个像素视为一个节点,像素和像素连线视为边。

from skimage import data, segmentation, color
from skimage import graph
from matplotlib import pyplot as plt


img = data.coffee()

plt.imshow(img)

labels1 = segmentation.slic(img, compactness=30, n_segments=400,
                            start_label=1)
out1 = color.label2rgb(labels1, img, kind='avg', bg_label=0)

g = graph.rag_mean_color(img, labels1, mode='similarity')
labels2 = graph.cut_normalized(labels1, g)
out2 = color.label2rgb(labels2, img, kind='avg', bg_label=0)

fig, ax = plt.subplots(nrows=2, sharex=True, sharey=True, figsize=(6, 8))

ax[0].imshow(out1)
ax[1].imshow(out2)

for a in ax:
    a.axis('off')

plt.tight_layout()

原理

 然而,这种方式会使得较为边缘的区域被单独分割出来。(数据分布不均衡)

所以,normalized cut算法改进了优化函数,提出了一种归一化距离的方式。

深度学习的语义分割

数据集

  • coco数据集:20万张标注数据,150万个对象实例,171个类别

  • human parsing dataset: 25403张图像,包含背景共59个类别

  • cityscapes: 30类,5000张细致标注数据,20000张粗标注数据
  • kitti

评价指标

  • 执行时间

  • 占用内容

  • 准确度(ACC)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/597814.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

饿了么太狠:面个高级Java,抖这多硬活、狠活(饿了么面试真题)

前言: 在40岁老架构师尼恩的(50)读者社群中,经常有小伙伴需要面试饿了么、 头条、美团、阿里、京东等大厂。有很多的小伙伴,完成了人生的逆袭,拿到了高端的offer。 最近一个6年经验的小伙伴,年…

linux进程间通信(共享内存)

共享内存,顾名思义就是允许两个不相关的进程访问同一个逻辑内存,共享内存是两个正在运行的进 程之间共享和传递数据的一种非常有效的方式。不同进程之间共享的内存通常为同一段物理内存。进程可 以将同一段物理内存连接到他们自己的地址空间中&#xff0…

win10 编译 openssl

环境:系统win10 编译器:VS2015 准备: 一、openssl下载 官网:www.openssl.org 安装Perl,安装NASM. cmd下运行perl --version得出下面信息就说明安装perl安装成功. nasm --version得出下面信息,说明nasm安装成功 我以vs2015为例: 打开这个终端,之所以打开这个是因…

适合每一个对高光谱技术感兴趣,并想用python进行实践的人

总结了高光谱遥感技术领域的基础原理与核心概念,采用编程语言复现经典数据处理和应用方法,追踪了最新的技术突破,在消化理解、触类旁通之后,用即使是遥感“小白”也容易接受的方式分享给你。 高光谱遥感学习的第一季:提…

HTTP的缓存机制是什么?

HTTP 缓存机制是一种在 Web 开发中常用的技术,它旨在提高性能和减少网络流量。通过缓存,可以避免不必要的网络请求,减少服务器负载,并加快页面加载速度。下面是关于 HTTP 缓存机制的详细介绍。 HTTP 缓存机制的基本原理是将 Web …

LNMP网站框架搭建(yum方式)

目录 一、Nginx的yum安装 1)搭建nginx相关的yum源 2)刷新yum仓库,安装启动nginx服务 二、mysql的 yum 安装 1)卸载一切与mysql有关的包 2)wget mysql相关的yum源 附加:第二种方式(与上…

单卡轻松打造 ChatGPT 竞争者“原驼”,QLoRA 革新大语言模型微调技术

出品人:Towhee 技术团队 作者:顾梦佳 由 OpenAI 推出的聊天机器人ChatGPT 爆火,带动 AI 受到了前所未有的关注。随之市面上也涌现出了各类开源的大语言模型(LLM),其中 LLaMA “羊驼系列”最受关注、最具潜力…

Vue实现订单确认界面禁止浏览器返回操作导致重复提交订单的问题

哈喽 大家好啊 最近遇到一个问题,就是在提交订单成功后的页面,然后用户去浏览器返回,就导致又提交了一次 然后就想到了如果提交成功页面,就阻止浏览器返回操作 主要实现如下: 1.在mounted的钩子函数: 2.…

每日一练 | 华为认证真题练习Day50

1、SWA和SWB的MAC地址表中,MAC地址、VLAN、端口对应关系正确的有?(多选) 2、PPP帧格式中的Flag字段的取值为? A. 0xFF B. 0x7E C. 0xEF D. 0x8E 3、ICMP报文不包含端口号,所以无法使用NAPT。 A. 对 B…

[ Term ] 你真的了解 UTC 时间吗?它和 GMT 时间的区别是什么?

什么是 GMT 和 UTC,他们之间的区别是什么? GMT(Greenwich Mean Time)和UTC(Coordinated Universal Time)是两个不同的时间标准,但它们非常相似并且通常被混淆使用,那他们之间的区别在…

后端从入门到转岗,如何转型

一、技术介绍 我学习的技术很多: 例如:JAVA JS C# python vue mysql Oracle 等等。 学习也是从入门开始 ,入口是JAVA 二、学习前的准备工作 学习前需要准备什么呢? 我觉得学习前最需要准备的是下定决心吃苦&#xff…

常见数据采集工具介绍

数据采集是指从各种数据源中收集数据并将其存储在一个地方,以便进行分析和处理。数据采集工具是帮助我们自动化数据采集过程的软件或服务。在本文中,我们将介绍一些常见的数据采集工具。 Web Scraper Web Scraper是一种免费的浏览器扩展,可…

低代码平台选型必看!让你少走弯路

目前低代码技术正处在风口,低代码平台产品不断涌现,乱花渐欲迷人眼。作为软件公司或企业IT部门的负责人,在做低代码平台的 选型时需要关注哪些方面,才能顺利“上车”,让低代码为自己的团队赋能? 除了产品功…

我的创作纪念日一周年

今天六一 祝大家节日快乐 ! 文章目录 机缘收获日常成就憧憬 机缘 其实好兄弟早在21年10月就已经注册了csdn账号,但是当初只是用来查找资料,也就是看别人写的博客吧,那时候感觉写博客好难,所以自己迟迟不敢尝试&#x…

如何将Linux命令默认的提示结果不显示或者不输出?以及在脚本中如何替代Ctrl + C等关闭命令的终端窗口?

一、问题描述: 当我们想要获取命令的输出结果时,有时候命令会带出一些默认的提示信息输出到屏幕上,如何过滤掉这个提示信息呢? 例如,telnet命令退出时会默认提示“Connection closed by foreign host.” 例如&#x…

如何使用一站式自动化测试平台TestOne进行App兼容性测试

首先,在讲主题之前,大家先了解移动兼容性测试包括哪些?然后再说,移动兼容性自动化测试方法有哪些?通过一站式自动化测试平台(英文名称:TestOne),具体如何来实现&#xff…

RPG 类型游戏开发基础教程

RPG 游戏开发基础教程 第一步 下载 RPG Maker 开发工具包 1.RPG Maker 是什么? RPG Maker 是由 Enterbrain 公司推出的 RPG 制作工具。 中文译名为 RPG 制作大师。 熟悉的人喜欢简称为 RM。 2、关于 RPG Maker MV? RMMV 是当前 RM 系列最新发行的一款 RPG 制作工…

神奇的开关 — 可控硅

带大家认识下可控硅,以及可控硅的工作原理 ...... by 矜辰所致目录 前言一、什么是可控硅1.1 基本概念1.2 可控硅的结构1.2.1 单向可控硅1.2.2 双向可控硅 二、可控硅的工作原理2.1 可控硅是如何工作的导通条件维持条件关断条件 2.2 工作原理 三、可控硅的参数四、…

Idea+maven+springboot项目搭建系列--2 整合Netty完成客户端服务器端消息收发

前言:Netty 作为主流的nio 通信模型应用相当广泛,本文在spring-boot 项目中集成Netty,并实现客户端以及服务器端消息的接收和发送;本文是 Spring架构篇–2.7 远程通信基础–使用Netty 的扩展; 1 spring-boot jar包引入…

C++进阶 —— (C++11新特性)

三,范围for循环 四,final与override 五,智能指针 六,静态数组array、forward_list、unordered系列(新增容器) 七,默认成员函数的控制 在C中,对于空类编译器会生成一些默认成员函数(如构造函数、拷贝构造函数…