一、图像基本知识
1、如何转换图片文件
回忆:之前我们在特征抽取中讲过如何将文本处理成数据
思考:如何将图片文件转换成机器学习算法能够处理的数据?
我们经常接触到的图片有两种,一种是黑白图片(灰度图),另一种是彩色图片
组成图片的最基本单位是像素
2、特征抽取
文本特征抽取:转换成数值,二维数组shape(n_samples, m_features)
n_samples行,m_features列
字典特征抽取:转换成数值,二维数组shape(n_samples, m_features)
one-hot编码
图片???
3、图片三要素
组成一张图片特征值是所有的像素值,有三个维度:图片长度、图片宽度、图片通道数
图片的通道数是什么?
描述一个像素点,如果是灰度图,那么只需要一个数值来描述它,就是单通道
如果一个像素点,有RGB三种颜色来描述它,就是三通道
灰度图:单通道
彩色图:三通道,RGB
4、图片的特征抽取
图片:转换成数值,三维数组shape(图片长度、图片宽度、图片通道数)
灰度图[长,宽,1]
每一个像素点是[0, 255]的数,越接近255越白
彩色图[长,宽,3]
每一个像素点是三个通道(每个通道又是一个灰度图)
一个彩色像素点是由三个通道像素点组合而成
每一个像素点用3个[0, 255]的数来表示