图像降采样的计算原理:F.interpolate INTER_AREA

news2024/11/15 14:01:20

一、F.interpolate——数组采样操作

torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None)


功能:利用插值方法,对输入的张量数组进行上\下采样操作,换句话说就是科学合理地改变数组的尺寸大小,尽量保持数据完整。

输入:

input(Tensor):需要进行采样处理的数组。
size(int或序列):输出空间的大小
scale_factor(float或序列):空间大小的乘数
mode(str):用于采样的算法。'nearest'| 'linear'| 'bilinear'| 'bicubic'| 'trilinear'| 'area'。默认:'nearest'
align_corners(bool):在几何上,我们将输入和输出的像素视为正方形而不是点。如果设置为True,则输入和输出张量按其角像素的中心点对齐,保留角像素处的值。如果设置为False,则输入和输出张量通过其角像素的角点对齐,并且插值使用边缘值填充用于边界外值,使此操作在保持不变时独立于输入大小scale_factor。
recompute_scale_facto(bool):重新计算用于插值计算的 scale_factor。当scale_factor作为参数传递时,它用于计算output_size。如果recompute_scale_factor的False或没有指定,传入的scale_factor将在插值计算中使用。否则,将根据用于插值计算的输出和输入大小计算新的scale_factor(即,如果计算的output_size显式传入,则计算将相同 )。注意当scale_factor 是浮点数,由于舍入和精度问题,重新计算的 scale_factor 可能与传入的不同。

注意:

输入的张量数组里面的数据类型必须是float。
输入的数组维数只能是3、4或5,分别对应于时间、空间、体积采样。
不对输入数组的前两个维度(批次和通道)采样,从第三个维度往后开始采样处理。
输入的维度形式为:批量(batch_size)×通道(channel)×[可选深度]×[可选高度]×宽度(前两个维度具有特殊的含义,不进行采样处理)
size与scale_factor两个参数只能定义一个,即两种采样模式只能用一个。要么让数组放大成特定大小、要么给定特定系数,来等比放大数组。
如果size或者scale_factor输入序列,则必须匹配输入的大小。如果输入四维,则它们的序列长度必须是2,如果输入是五维,则它们的序列长度必须是3。
如果size输入整数x,则相当于把3、4维度放大成(x,x)大小(输入以四维为例,下面同理)。
如果scale_factor输入整数x,则相当于把3、4维度都等比放大x倍。
mode是’linear’时输入必须是3维的;是’bicubic’时输入必须是4维的;是’trilinear’时输入必须是5维的
如果align_corners被赋值,则mode必须是'linear','bilinear','bicubic'或'trilinear'中的一个。
插值方法不同,结果就不一样,需要结合具体任务,选择合适的插值方法。


补充:

align_corners=True与False的区别,从4×4上采样成8×8。一个是按四角的像素点中心对齐,另一个是按四角的像素角点对齐。

二、INTER_AREA究竟是在做啥?【转载】

INTER_AREA显得神神秘秘,因为它在OpenCV的文档里是这么写的:

resampling using pixel area relation. It may be a preferred method for image decimation, as it gives moire’-free results. But when the image is zoomed, it is similar to the INTER_NEAREST method.

然后什么叫“resampling using pixel area relation”(用像素面积关系重采样)呢?像素面积关系是什么关系?这

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/907369.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为云开发工具CodeArts IDE for C/C++ 开发使用指南

简介 CodeArts IDE是一个集成开发环境(IDE),它提供了开发语言和调试服务。本文主要介绍CodeArts IDE for C/C的基本功能。 1.下载安装 CodeArts IDE for C/C 已开放公测,下载获取免费体验 2.新建C/C工程 CodeArts IDE for C/…

春秋云境:CVE-2022-0543(Redis 沙盒逃逸漏洞)

目录 一、i春秋题目 二、CVE-2022-0543:(redis沙盒逃逸) 漏洞介绍: 漏洞复现: 一、i春秋题目 靶标介绍: Redis 存在代码注入漏洞,攻击者可利用该漏洞远程执行代码。 进入题目:…

数字孪生技术应用:智能制造、城市规划与更多

数字孪生可以用在哪些场景下?这个问题引发了无数创新思考和应用探索。随着科技的不断进步,数字孪生技术正逐渐展现出其广泛的应用前景,不仅在工业制造,还在城市规划、农业等多个领域呈现出独特的价值。 在工业制造领域&#xff0…

jenkins的安装和配置(flask结合jenkins半自动化部署流程)

jenkins在虚拟机中安装 1.1 背景介绍 Jenkins 是一款流行的开源持续集成(Continuous Integration)工具,广泛用于项目开发,具有自动化构建、测试和部署等功能。 Jenkins官网: Jenkins Jenkins 特征 开源的Java语言开发…

无涯教程-PHP - 静态变量函数

静态变量 静态变量在函数退出时值不会丢失,您只需将关键字STATIC放在变量名称的前面,即可将变量声明为静态变量。 <?phpfunction keep_track() {STATIC $count0;$count;print $count;print "<br />";}keep_track();keep_track();keep_track(); ?> 这…

openstack安装使用(Yoga版本)

演示具体只体现centos配置&#xff0c;至于Ubuntu和SUSE&#xff0c;请移步官方文档 安装指南 官方网址&#xff1a;https://docs.openstack.org/install-guide/common/conventions.html $ command #任何用户&#xff08;包括root用户&#xff09;都可以运行以提示符为前缀的…

测试框架pytest教程(6)钩子函数hook

在pytest中&#xff0c;"hook"是用于自定义和扩展测试流程的机制。它允许你在特定时间点插入自己的代码&#xff0c;以便对测试进行修改、补充或拦截。 pytest的hook是基于Python的插件系统实现的&#xff0c;使用特定的命名规范和装饰器来定义钩子函数。你可以在py…

uniapp打包后开屏出现广告

最近的一次打包上线后&#xff0c;安卓端出现了开屏广告&#xff0c;这就比较离谱了&#xff0c;没有改啥&#xff0c;这广告来得莫名其妙&#xff0c;查阅了官方文档后&#xff0c;发现文档太老&#xff0c;也没有及时更新… 咱们在打包时&#xff0c;通常会发现广告这里的【开…

日产将使用东风纯电平台?官方回应:不是日产品牌

据财联社报道&#xff0c;日产中国在对于“日产将使用东风纯电平台”的传闻进行回应时指出&#xff0c;文中提及的平台将会用于日产在华合资企业的自主品牌&#xff0c;而不是日产品牌本身。这一消息进一步确认了之前每经网的报道&#xff0c;称日产将采用东风汽车最新发布的“…

C# OpenCvSharp DNN 二维码增强 超分辨率

效果 项目 代码 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using OpenCvSharp; using OpenCvSharp.Dnn; using OpenCvSh…

new String创建几个对象

在java17中 &#xff1a; 问题1&#xff1a;new String("abc")会产生多少个对象&#xff1f; 分两种情况&#xff1a; 情况1&#xff1a; 如果”abc”这个字符串常量不存在&#xff0c;则创建两个对象&#xff0c;分别是“abc”这个字符串常量&#xff0c;以及ne…

Linux Kernel 4.12 或将新增优化分析工具

到 7 月初&#xff0c;Linux Kernel 4.12 预计将为修复所有安全漏洞而奠定基础&#xff0c;另外新增的是一个分析工具&#xff0c;对于开发者优化启动时间时会有所帮助。 新的「个别任务统一模型」&#xff08;Per-Task Consistency Model&#xff09;为主要核心实时修补&#…

PPT操作技巧:如何对文档进行保护和加密

辛辛苦苦设计出的PPT&#xff0c;不希望呗别人拿去当“模板”&#xff1b; PPT中包含项目的关键内容或公司的重要信息&#xff0c;不希望泄露&#xff1b; …… 这些情况下&#xff0c;我们肯定需要找办法来保护自己的PPT。 小编今天就来跟大家分享几个实用的PPT加密保护技巧。…

怎么用gif合成将视频转gif?推荐使用这款视频转gif工具

想要将喜欢的视频片段转换成gif动态图&#xff0c;可以试试今天分享的这款视频转gif工具&#xff0c;支持视频在线转gif&#xff0c;无需下载多余gif合成&#xff08;https://www.gif.cn&#xff09;工具&#xff0c;赶紧来看看怎么操作的吧。 打开网站&#xff0c;在首页选择…

如何查看Linux内核版本

如何查看Linux内核版本 uname -r用centos7.0&#xff0c;内核版本就是3.10

测试框架pytest教程(8)失败重试-pytest-rerunfailures

pytest-rerunfailures是一个pytest插件&#xff0c;用于重新运行失败的测试用例。当测试用例在第一次运行时失败&#xff0c;该插件会自动重新运行指定次数的失败用例&#xff0c;以提高稳定性和减少偶发性错误的影响。 要使用pytest-rerunfailures插件&#xff0c;需要按照以…

余承东确认:新问界M7将在2023年成都车展亮相,全车投入超 5亿元

据报道&#xff0c;AITO官方近日宣布&#xff0c;新款问界M7将在2023年成都车展上进行亮相&#xff0c;具体日期为8月25日。从官方预热海报来看&#xff0c;新款问界 M7将定位为一款大五座SUV&#xff0c;车身前脸相比上一代车型没有太大变化&#xff0c;底部格栅似乎采用了封闭…

解码全栈开发工程师

写在前面 你想成为一名全栈工程师吗&#xff1f;在如今这个大兴降本增效的时代&#xff0c;“全栈”似乎被动的成为了大部分开发者的最终归宿。 在一部分人眼中&#xff0c;全栈代表着更快的成长速度、更丰富的岗位选择&#xff0c;更全面的技术栈也能够为晋升管理岗铺平道路。…

如何准备软件开发项目成本估算?

软件开发的成本估算是出了名的困难。对于软件开发项目来说&#xff0c;预算超支反而是常态&#xff0c;而不是例外。 在开始估算之前&#xff0c;请从业务角度了解项目的战略目标和你的目标。你可能计划尽可能赚取更多利润&#xff0c;探索新技术&#xff0c;或者在项目可能亏…