在深度学习中 上采样是将图像放大
如上图所示 要求放大后的图像坐标(2,1)处的像素值 要找到目标图像中对应的原图像素 需要与扩大前和扩大后的边长比相乘得到一个坐标(1.5,0.75) 对应原图中没有一个像素点是重合的 蓝色框框的像素值与红色框框的四个点的像素值有关 相关的计算方法就需要用到双线性插值
学双线性插值前需要学习一下单线性插值:
单线性插值
在二维坐标系下 有两个已知点(x0,y0)和(x1,y1) 现在插入了一个值x 需要求x处的y值
根据初中学过的知识(斜率公式)可以得到:
联系到图像处理:
p就是插入像素的像素值
双线性插值
如图 插入的点是红色的(x,y)
已知的有4个点 为灰色的(x1,y1) (x2,y1) (x1,y2) (x2,y2) 对应的像素值为P11,P21,P12,P22
注意P不是坐标系的Z轴 只是便于观察
要求的是(x,y)处的像素值P
沿x轴方向的平面:
就是图中的这一部分:
可以进行一次单线性插值得到P1处的像素值
以此类推得到x2处的像素值:
得到了P1,P2之后 就可以沿y轴方向 再进行一次单线性插值得到P处的像素值
将P1,P2带入得:
化简过程:
根据红色圈住的四个点 可以得到一个关系:
代入到上面的式子可以发现分母全都变成1了
具体含义:
式子中的(y2-y)的值都是相同的 所以与这个无关 P11后面的(x2-x)可以理解为x2与x之间的距离 进一步可以理解为是权重 如果(x2-x)越大 那么所求P点的像素值就越接近于P11处的像素值
所以可以将(x2-x)看作是W1: