图像相关的基础知识【RGB和RGBA】

图像相关的基础知识【RGB和RGBA】—附python代码实现

news2025/4/17 15:44:52

文章目录

1、图像基础知识
2、像素和通道的理解
3、RGB和RGBA
- RGB (Red, Green, Blue)
- RGBA (Red, Green, Blue, Alpha)
- 应用场景
4、H,W,C
5、小结

🍃作者介绍：双非本科大三网络工程专业在读，阿里云专家博主，专注于Java领域学习，擅长web应用开发、数据结构和算法，初步涉猎人工智能和前端开发。
🦅个人主页：@逐梦苍穹
📕所属专栏：人工智能
🌻gitee地址：xzl的人工智能代码仓库
✈ 您的一键三连，是我创作的最大动力🌹

1、图像基础知识

知道像素、通道等概念
掌握使用matplotlib加载图片方法

我们在进行图像任务时，需要了解图像的基础知识。
图像是由像素点组成的，每个像素点的值范围为 [0, 255]，像素值越大意味着较亮。
比如一张200x200的图像，则是由40000个像素点组成，如果每个像素点都是0的话，意味着这是一张全黑的图像。
我们看到的彩色图一般都是多通道的图像，所谓多通道可以理解为图像由多个不同的图像层叠加而成，例如我们看到的彩色图像一般都是由RGB三个通道组成的，还有一些图像具有RGBA四个通道，最后一个通道为透明通道，该值越小，则图像越透明。

2、像素和通道的理解

接下来，我们使用 matplotlib 库来实际理解下上面讲解的图像知识。
示例代码：

# -*- coding: utf-8 -*-
# @Author: CSDN@逐梦苍穹
# @Time: 2024/7/31 23:38

# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image


# 1. 图像基本理解
def test01():
    # 创建一个200x200的全零数组（黑色图像）
    img = np.zeros([200, 200])
    # 打印图像数据
    print(img)
    # 显示图像，使用灰度颜色映射，值范围0到255
    # plt.figure(figsize=(12, 6))
    # TODO 同一图形窗口内创建多个子图的函数, 参数: 行数、列数、当前子图索引(从1开始)
    plt.subplot(1, 2, 1)
    plt.imshow(img, cmap='gray', vmin=0, vmax=255)

    # 创建一个255x255的全255数组（白色图像）
    img = np.full([255, 255], 255)
    # 打印图像数据
    print(img)
    # 显示图像，使用灰度颜色映射，值范围0到255
    plt.subplot(1, 2, 2)

    plt.imshow(img, cmap='gray', vmin=0, vmax=255)
    # 显示图像窗口
    plt.show()


# 2. 图像的通道
def test02():
    # 读取彩色图像
    # img = plt.imread('data/彩色图片.png')
    img = np.array(Image.open('data/彩色图片RGBA.png'))
    # 修改数据的维度，从(H, W, C)到(C, H, W)
    img = np.transpose(img, [2, 0, 1])
    print(img.size)
    print(img.shape[0])
    print(img)
    # 打印所有通道
    forNumber = img.shape[0]
    for i in range(forNumber):
        channel = img[i]
        # 打印当前通道的数据
        print(channel)
        if forNumber / 2 >= i:
            plt.subplot(2, 2, i + 1)
            plt.imshow(channel, cmap='gray')
        # 显示当前通道的图像
        plt.subplot(2, 2, i + 1)
        plt.imshow(channel)

    # 自适应布局
    plt.tight_layout()
    plt.show()

    # 修改透明度通道，设为0.05
    img[3] = 1
    print("-" * 50)
    print(img)
    # 将图像数据维度从(C, H, W)改回(H, W, C)
    img = np.transpose(img, [1, 2, 0])
    # 显示修改后的图像
    plt.imshow(img)
    # 显示图像窗口
    plt.show()


# 主函数入口
if __name__ == '__main__':
    # 调用test01函数
    test01()
    # 调用test02函数
    test02()