【PyTorch】【机器学习】图片张量、通道分解合成和裁剪

news2025/4/15 11:05:39

一、导入所需库

from PIL import Image
import torch
import numpy as np
import matplotlib.pyplot as plt

二、读取图片

pic = np.array(Image.open('venice-boat.jpg'))

上述代码解释：先用Image.open()方法读取jpg格式图片，再用np.array()方法将图片转成numpy数组（ndarray）格式。

三、建立张量

图片在PyTorch中以3维张量表示。以下代码将图片转换成张量形式：

pic_tensor = torch.from_numpy(pic)

打印张量数据内容：

print(pic_tensor)

输出：

tensor([[[ 47, 138, 221],  # 每个像素点的RGB颜色值
         [ 49, 138, 220],
         [ 50, 139, 221],
         ...,
         [ 89, 149, 221],
         [ 87, 150, 221],
         [ 86, 149, 220]],

        [[ 47, 138, 221],
         [ 49, 138, 220],
         [ 50, 139, 221],
         ...,
         [ 88, 148, 220],
         [ 85, 148, 219],
         [ 85, 148, 219]],

        [[ 47, 138, 221],
         [ 49, 138, 220],
         [ 50, 139, 221],
         ...,
         [ 84, 147, 218],
         [ 84, 147, 218],
         [ 83, 146, 217]],

        ...,

四、通过张量对图片进行操作

（注：在以下的各个操作下，还需要用plt.show()语句才能将图片输出到屏幕上。）

1、打印整张图片

plt.imshow(pic)

在这里插入图片描述

2、分RGB通道打印图片

输出通道1：

plt.imshow(pic_tensor[:, :, 0].numpy())

在这里插入图片描述

输出通道2：

plt.imshow(pic_tensor[:, :, 1].numpy())

在这里插入图片描述

输出通道3：

plt.imshow(pic_tensor[:, :, 2].numpy())

在这里插入图片描述
注意： 三通道并不是简单的算术叠加，例如以下代码的输出和原图大相径庭：

from PIL import Image
import torch
import numpy as np
import matplotlib.pyplot as plt


pic_1 = np.array(Image.open('Channel_1.jpg'))
pic_2 = np.array(Image.open('Channel_2.jpg'))
pic_3 = np.array(Image.open('Channel_3.jpg'))

pic_tensor_1 = torch.from_numpy(pic_1)
pic_tensor_2 = torch.from_numpy(pic_2)
pic_tensor_3 = torch.from_numpy(pic_3)

pic_tensor = pic_tensor_1 + pic_tensor_2 + pic_tensor_3
plt.imshow(pic_tensor.numpy())

plt.show()

输出图片：

在这里插入图片描述

3、裁剪图片

对图片张量的裁剪在其前2个维度上进行（第3个维度为颜色通道），示例代码如下：

plt.imshow(pic_tensor[50: 1050, 400: 800, :].numpy())

裁剪结果：

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1849336.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【PyTorch】【机器学习】图片张量、通道分解合成和裁剪

一、导入所需库

二、读取图片

三、建立张量

四、通过张量对图片进行操作

1、打印整张图片

2、分RGB通道打印图片

输出通道1：

输出通道2：

输出通道3：

3、裁剪图片

相关文章

图解Transformer

基于CST的连续域束缚态（BIC）设计与机制研究

MySQL操作语句练习【经典20题】

EM算法数学推导

qt 简单实验读取json格式的配置文件

python-邮票组合问题

Stable Diffusion 3 文本生成图像在线体验原理分析

Linux常用命令（16）—awk命令（有相关截图）

秋招突击——6/21——新作{两两交换链表中的节点,K个一组反转链表}

GIT回滚

一句话、10秒，我用Claude 3.5 Sonnet生成了完整的俄罗斯方块！

大模型项目落地时，该如何估算模型所需GPU算力资源

没等来百度惊艳的All in AI，却等来了国产之光的盘古大模型 5.0

细说MCU输出两路PWM波形及改变占空比的实现方法

win制作git局域网仓库，克隆

天马学航——智慧教务系统(移动端)开发日志八

【Java】已解决java.io.InterruptedIOException异常

发布微信小程序需要icp证吗？

超级干货！数据平滑9大妙招(python版）_python指数平滑预测案例

体验一下 Claude 3.5 Sonnet