压缩编码之离散余弦变换(DCT)之不同块大小对图像质量和压缩效果的影响的python实现

news2025/1/18 8:44:05

原理

离散余弦变换(DCT)是一种在图像压缩中广泛使用的技术,特别是在JPEG图像格式中。

离散余弦变换(DCT)的作用:DCT的主要目的是将图像从空间域(即像素表示)转换到频率域。在频率域中,图像的信息被表示为不同频率的余弦波的组合。高频成分通常对应于图像中的细节部分(如边缘),而低频成分则对应于图像中的平滑区域。

块大小的影响:

小块大小(如2x2):更小的块能更好地捕捉高频细节,因为它们局限于较小的区域。这导致在变换后的系数中保留了更多的高频信息。然而,这也意味着需要处理更多的块,从而增加了计算量和可能的压缩效率降低。
大块大小(如8x8,JPEG标准中使用):较大的块倾向于捕捉更多的低频信息,且因为它们覆盖了较大的区域,所以可能无法精确表示高频细节(如尖锐边缘)。但是,较大的块通常意味着更高的压缩率,因为在每个块中,许多高频系数可以被忽略(设置为零),而不会显著影响视觉质量。
压缩与质量的权衡:在DCT和图像压缩中,总是存在着数据量(压缩率)和图像质量之间的权衡。压缩图像通常涉及保留更多的低频信息(因为它们对人眼更重要)并丢弃或减少高频信息。块的大小直接影响这种权衡:较小的块提供更好的图像质量但较低的压缩率,而较大的块则提供更高的压缩率但可能牺牲图像的细节质量。

变换系数的阈值处理:在DCT后,通常会对变换系数进行阈值处理,即保留最重要的系数(通常是最大的系数,代表了图像中最显著的频率成分),而将其它系数设置为零。这种方法在大块尺寸下特别有效,因为在这些情况下,仅需要少量的系数就能代表整个块的主要信息。

总结:离散余弦变换(DCT)在图像处理中的应用涉及块大小选择的重要考虑。不同的块大小会影响DCT在压缩效率和图像质量之间的平衡,小块更适合高频细节的保留,而大块更有利于高压缩率的实现,但可能牺牲一些细节质量。理解这些原理有助于在图像压缩和处理中做出更合适的技术选择。

编写代码实现下图

在这里插入图片描述

提示

结果图显示了采用不同子图像大小时,仅保留25%的DCT系数重建的图像。只保留25%幅值最大的DCT系数。可以看到,随着子图像尺寸的增大,块效应逐渐减小。

python代码实现

import cv2
import numpy as np
import  matplotlib.pyplot as plt
img=cv2.imread("lena_eye.tif",0)
img=img.astype(np.float)
rows,cols=img.shape
img_list = [img]
img_name_list = ['original']
blk_size = [2, 4, 8]
for n in blk_size:
    dct_inv_img = np.zeros(img.shape)
    coeff_num = int(0.75 * (n**2))
    for i in range(0, rows, n):
        for j in range(0, cols, n):
            dct = cv2.dct(img[i:i+n, j:j+n])
            dct_amp = np.abs(dct)
            idx = np.argpartition(dct_amp.ravel(), coeff_num)[:coeff_num]
            idx2d = np.unravel_index(idx, dct.shape)
            dct[idx2d] = 0

            dct_inv_img[i:i+n, j:j+n] = cv2.idct(dct)

    img_list.append(dct_inv_img)
    img_name_list.append('n=' + str(n))

_, axs = plt.subplots(2, 2)
for i in range(2):
    for j in range(2):
        axs[i, j].imshow(img_list[i*2+j], cmap='gray')
        axs[i, j].set_title(img_name_list[i*2+j])
        axs[i, j].axis('off')
plt.show()

结果展示

在这里插入图片描述

DPI

图像尺寸的长度与宽度是以像素为单位的,有的是以厘米为单位。像素与分辨率像素是数码影像最基本的单位,每个像素就是一个小点,而不同颜色的点(像素)聚集起来就变成一幅动人的照片,数码相机经常以像素作为等级分类依据,但不少人认为像素点的多少是CCD光敏单元上的感光点数量,其实这种说法并不完全正确,不少厂商通过特殊技术,可以在相同感光点的CCD光敏单元下产生分辨率更高的数码相片,
图片分辨率越高,所需像素越多,比如:分辨率640×480的图片,大概需要31万像素,2048×1536的图片,则需要高达314万像素。
分辨率可有多个数值,相机提供分辨率越多,拍摄与保存图片的弹性越高。
图片分辨率和输出时的成像大小及放大比例有关,分辨率越高,成像尺寸越大,放大比例越高。
总像素数是指CCD含有的总像素数。不过,由于CCD边缘照不到光线,因此有一部分拍摄时用不上。从总像素数中减去这部分像素就是有效像素
图像分辨率为数码相机可选择的成像大小及尺寸,单位为dpi。常见的有640 x 480;1024 x 768;1600 x 1200;2048 x 1536。在成像的两组数字中,前者为图片宽度,后者为图片的高度,两者相乘得出的是图片的像素。长宽比一般为4:3。
在大部分数码相机内,可以选择不同的分辨率拍摄图片。一台数码相机的像素越高,其图片的分辨率越大。分辨率和图象的像素有直接的关系,一张分辨率为640 x 480的图片,那它的分辨率就达到了307200,也就是我们常说的30万像素,而一张分辨率为1600 x 1200的图片,它的像素就是200万。这样,我们就知道,分辨率表示的是图片在长和宽上占的点数的单位。台数码相机的最高分辨率就是其能够拍摄最大图片的面积。在技术上说,数码相机能产生在每寸图像内,点数最多的图片,通常以dpi为单位,英文为Dot per inch。分辨率越大,图片的面积越大。像素越大,分辨率越高,照片越清晰,可输出照片尺寸也可以越大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1384960.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【MATLAB随笔】GUI编程(未完结)

文章目录 一、创建图窗1.1 figure 函数详解1.11 窗口标识1.12 窗口外观1.13 位置和大小 二、xxx 一、创建图窗 跟很多GUI编程一样的,先创建一个基本的图窗,然后再添加按钮、文章、标签,绑定函数等等,比如python的tkinter。 MATL…

ES数据聚合

1.数据聚合 聚合(aggregations)可以让我们极其方便的实现对数据的统计、分析、运算。例如: 什么品牌的手机最受欢迎? 这些手机的平均价格、最高价格、最低价格? 这些手机每月的销售情况如何? 实现这些…

数组笔试题详解

文章目录 数组笔试题解析总结: 数组笔试题解析 我们可以通过做题来加深我们对数组及相关知识的理解,下面的笔试题解答正确的关键在于下面这点,一定要牢记: 数组名是首元素地址,两种情况除外: 1.sizeof(数组名) , 这是这是计算整个数组的大小,单位是字节; 2.&数组名 , 得出…

任务6:启动Hadoop集群并测试

任务描述 知识点: 掌握Hadoop集群的启动 重 点: Hadoop集群的格式化流程Hadoop集群的启动流程 内 容: 格式化Hadoop集群启动测试Hadoop集群 任务指导 启动Hadoop集群并测试,过程如下: 初始化HDFS&#xff1…

C#编程-使用事件

使用事件 事件是一个动作或发生的事情,例如:鼠标点击、按键、鼠标移动或系统产生的通知。应用程序可以在事件发生的时候做出响应。通知的一个示例是中断。事件是对象发生的消息以表示事件的发生。事件是进程内通信的有效方法。它们对对象时有用的,因为它们标识了单个状态改…

Redis-redis.conf配置文件中的RDB与AOF持久化方式的详解与区别

RDB(Redis Database) RDB是Redis的默认持久化方式,它将内存中的数据以二进制格式写入磁盘,形成一个快照。RDB持久化有以下几个重要的配置选项: save:指定了保存RDB的策略,默认的配置是每900秒&…

解锁 JavaScript 数组的强大功能:常用方法和属性详解(下)

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

SpringFramework实战指南(一)

SpringFramework实战指南(一) 一、技术体系结构1.1 总体技术体系1.2 框架概念和理解 一、技术体系结构 1.1 总体技术体系 单一架构 一个项目,一个工程,导出为一个war包,在一个Tomcat上运行。也叫all in one。 单一架…

Redis常见命令、数据类型

我们可以通过Redis的中文文档:Redis命令中心(Redis commands) -- Redis中国用户组(CRUG),来学习各种命令。 也可以通过菜鸟教程官网来学习:Redis 键(key) | 菜鸟教程 一、Redis数据结构介绍 Red…

UML-顺序图

提示:用例图从参与者的角度出发,描述了系统的需求(用例图);静态图定义系统中的类和对象间的静态关系(类图、对象图和包图);状态机模型描述系统元素的行为和状态变化流程(…

快速入门Java NIO(New I/O)的网络通信框架--Netty

Netty 入门 了解netty前需要对nio有一定认识,该笔记基础来自bilinbili黑马,在此基础上自己学习的笔记,添加了一些自己的理解 了解java 非阻塞io编程 1. 概述 1.1 Netty 是什么? Netty is an asynchronous event-driven network application framework for rapid …

关于AMC8模拟考试延长到1月19日14点,以及常见的几个新问题

相信过去的周末两天,很多参加今年AMC8美国数学思维竞赛活动的孩子们都参加了AMC8模拟考试。昨天有家长问六分成长,周末两天因故没能参加要不要紧?如果还想参加怎么办? 不用担心!官方已经把AMC8模拟考试的时间延长到1月…

【Redis】AOF 源码

在上篇, 我们已经从使用 / 机制 / AOF 过程中涉及的辅助功能等方面简单了解了 Redis AOF。 这篇将从源码的形式, 进行深入的了解。 1 Redis 整个 AOF 主要功能 Redis 的 AOF 功能概括起来就 2 个功能 AOF 同步: 将客户端发送的变更命令, 保存到 AOF 文件中AOF 重写: 随着 Red…

Python 潮流周刊#35:Python JIT 编译器和 Numpy2 即将推出

△△请给“Python猫”加星标 ,以免错过文章推送 你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。本周刊开源,欢迎投稿[1]。另有电报频道[2]作为副刊,补充发布更加丰富的资讯,…

【Java SE语法篇】9.抽象类和接口

📚博客主页:爱敲代码的小杨. ✨专栏:《Java SE语法》 ❤️感谢大家点赞👍🏻收藏⭐评论✍🏻,您的三连就是我持续更新的动力❤️ 文章目录 1. 抽象类1.1 抽象类的概念1.2 抽象类的语法1.3 抽象…

VScode设置自动添加自定义注释及修改字体

首先安装snippet mac可以键入commanp,输出> 选择自己所需的需要自动添加的文件类型配置文件 安装自己的需要修改 "Print to console": {"prefix": "xx", // 自己键入内容"body": [ // 注释信息"// xxx …

【NI国产替代】USB‑7846 Kintex-7 160T FPGA,500 kS/s多功能可重配置I/O设备

Kintex-7 160T FPGA,500 kS/s多功能可重配置I/O设备 USB‑7846具有用户可编程FPGA,可用于高性能板载处理和对I/O信号进行直接控制,以确保系统定时和同步的完全灵活性。 您可以使用LabVIEW FPGA模块自定义这些设备,开发需要精确定时…

canvas创建图像数据,并在画布上展示

查看专栏目录 canvas示例教程100专栏,提供canvas的基础知识,高级动画,相关应用扩展等信息。canvas作为html的一部分,是图像图标地图可视化的一个重要的基础,学好了canvas,在其他的一些应用上将会起到非常重…

Python学习从0到1 day4 python格式化输出和输入方法

其实我不是我,我是青山辽阔 ——24.1.14 一、百分号形式的格式化输出 1.普通输出 #1.定义一些变量 name 陈浩南 age 25 address 广州市天河区#2.变量的输出(普通输出) print(name) print(age) print(address)#3.Python中,还允…

【矩阵快速幂】封装类及测试用例及样例

作者推荐 视频算法专题 通俗的说&#xff0c;就是矩阵的乘方。 封装类 核心代码 class CMat { public:// 矩阵乘法static vector<vector<long long>> multiply(const vector<vector<long long>>& a, const vector<vector<long long>…