先取yuv 文件中一个16×8的块,跑通全流程
理解与思路:
1.块分割
YUV 文件分为:YUV444 YUV 422 YUV420。444:就是:12个char 有4个Y,4个U,4个 U,422:8个char 中有4个Y ,U,V各两个,420:意思就是8char里有6个Y,1个U,1个V。444与422 中的三分量多是交错存储的,420则是先存储Y,再存储U,V。
YUV存储也是线型存储的,不是平面块存储的。
对应到jpeg,也要按YUV的三种格式分别分块。jpeg协议中有一概念MCU:最小编码块。jpeg就是按MCU 为单位循环存储的。MCU中又有若干8×8 的block。这些block 就是Y ,U ,V 分量的8×8 块。
我理解:对应YUV444, 一行内取24字节(这是指水平行,程序处理同时要取8个水平行,意思MCU=8×24字节)。含有Y,U,V各8个字节。也就是说:程序一次读取8行24个char ,处理成3张8×8的表,直到读完整个yuv文件
YUV422:一行 8个char中有4个Y,UV各2个。必须把Y凑成8那就要乘2。那就是一行为16个字节,MCU=16×8,取8行生成一张8×8的Y,UV 各半张,UV要补0成为8×8。
YUV420:一行8个字节中有6个Y,UV各一个,Y×8成为8的倍数水平要取64字节,所以,MCU=8×8×8,意思就是有6张Y表,UV 各一张。
离散余弦变换
找了一组数据来验证,发现余弦转换除了直流分量外都正确,DC不正确,也就是转换后第一个数不正确,才想到第一个数的取值应该超出了char的取值范围-128<char<127,所以换用int存储所以数值
2.量化
Jpeg几乎对Y分量不压缩处理,只压缩UV彩色分量。把几个Y拼在一起余弦处理因为余弦转化是没有损失的,也不会让数据失真。真正让数据失真是量化这个环节,如果量化表全为1,则是无损量化。
下面的程序为借用成品图片的量化表。
3. Z形排序
采用查表法,先按Z顺序生成一个表,读数时按表的数值作为读取位置。
4. 去0
64个数中按位读取每一个数有4种情况:
a) 本为是0,下一位也是0,但下一位不是数据结尾
b)本位是0,下一位是0,但下一位是结尾
c)本位是0,下一位不是0
d)本位不是0
判断生成的结果存储到2位数组中,第一位存储非0数字,第二位存储0的个数
5. 规范RLC 格式:去0后的数如中间有超过15个0,必须拆分; 结尾如有多个0改写为(0,0)
Z 型排序这理还有一个细节错误,应该把直流DC 分出来,只排63个交流系数。
等霍夫曼编码时再修改过来
6. 范式霍夫曼编码
准备借用成品jpeg图片的霍夫曼表来编码。
这里还有几个问题没有搞明白,编码是变长度的比特流不是字节,而c操作的最小单位是字节char, 是怎样把比特流写入内存甚至文件的,难道是以比特流按8个比特为一个单位组成一个字节再写入?
从网上下载了一数据表验证本程序,从余弦转换开始到霍夫曼编码环节止数据只有4舍5入造成的微小差别。
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/ioctl.h>
#include <linux/videodev2.h> //v4l2 头文件
#include <string.h>
#include <sys/mman.h>
#include <linux/fb.h>
#include <math.h>
#define PI 3.1415926
#define pic_width 1280 //1280*720 640*360 960*540 320*240 424*240 848*480 640*480
#define pic_heigth 720
#define filename "/home/wjs/Pictures/1.yuv"
#define file1 "/home/wjs/Pictures/1.jpg" //借用成品图片的量化表
//int fdct(char (*i)[8], char (*o)[8] );
int main(void) {
//-----------FDCT()函数------------------------------------
int fdct(char (*i)[8], int(*o)[8] ) { //i 为输入 o 为参数传入的输出转换后的数据
double s;
double au;
double av;
for (int u = 0; u < 8; u++) {
for (int v = 0; v < 8; v++) {
for (int y = 0; y < 8; y++) {
for (int x = 0; x < 8; x++) {
s = s + (1.0 / 4) * i[y][x] * cos((2 * y + 1) * u * PI / 16) * cos((2 * x + 1) * v * PI / 16);
}
}
if (u == 0) {
au = 1.0 / sqrt(2);
} else {
au = 1.0;
}
if (v == 0) {
av = 1.0 / sqrt(2);
} else {
av = 1.0;
}
s = s * au * av; //-30.1856
int s1 = round(s * 100); //-3019
s = s1 / 100.0; //-30.19
o[u][v] = s; //double 转为char 类型
s = 0;
}
}
return 0;
}
//-----------规范RLC格式---------------------
int zl(int len,int (*i)[2],int (*o)[2]){
int t=0; //如果中间有一次超过15个0,o的下标要加一,因为增加了(15,0)
for(int a=0;a<len;a++){
if((a<len)&&(i[a][1]>=16)&&(i[a][0]!=0)){
o[a+t][0]=0;
o[a+t][1]=15;
o[a+1+t][0]=i[a][0];
o[a+1+t][1]=i[a][1]-15;
t++;
}
if((a<len)&&(i[a][1]<16)){
memcpy(&(o[a+t][0]),&(i[a][0]),8); //一行为单位复制
}
if((a==len)&&(i[a][0]==0)){
o[a+t][0]=0;
o[a+t][1]=0;
break;
}
}
return len+t;
}
//-----------去0-----------------------------
int q0(int i[64], int (*o)[2]) {
int t = 0; //输出数组序号
int z = 0; //计算连续的0
for (int a = 0; a < 64; a++) { // a
if ((i[a] == 0) && (i[a + 1] == 0) && ((a + 1) < 63)) { //000001
z++;
} // a
if ((i[a] == 0) && (i[a + 1] == 0) && ((a + 1) == 63)){ //0000结束
z++; //本次的0
o[t][0] =0;
o[t][1] = z+1; //加a+1的0
break; //判断完成
} // a
if ((i[a] == 0) && (i[a + 1] != 0)) { //000100
z++; //加上本次的一个0
o[t][0] = i[a + 1];
o[t][1] = z;
z = 0; //清0,计算下次的连续0
t++;
a = a + 1;
}
if ((i[a] != 0)&&(a==0)) { //第一个数非0
o[t][0] = i[a];
o[t][1] = 0;
t++;
}
if ((a>0)&&(i[a] != 0)&&(i[a-1]!=0)) { //防止第3种重复读取,这种是读取连续的非0
o[t][0] = i[a];
o[t][1] = 0;
t++;
}
}
return t+1;
}
//--------Z 排序--------------------------------
int zz(int (*i)[8], int o[64]) {
int zb[64] = {0,1,8,16,9,2,3,10,17,24,32,25,18,11,4,5,12,19,26,33,40,48,41,34,27,20,13,6,
7,14,21,28,35,42,49,56,57,50,43,36,29,22,15,23,30,37,44,51,58,59,52,45,38,31,39,46,53,60,61,54,47,
55,62,63
};
int *p = (int *)i;
for (int a = 0; a < 64; a++) {
int c = zb[a];
o[a] = p[c];
}
return 0;
}
// -----量化函数---------------
int lh(int (*i)[8], char (*lhb)[8], int (*o)[8]) {
for (int a = 0; a < 8; a++) {
for (int b = 0; b < 8; b++) {
o[a][b] = round((i[a][b]) / (lhb[a][b]));
}
}
return 0;
}
FILE *f1 = fopen(file1, "rb"); //如用mmap 必须以读写方式打开文件
if (f1 == NULL) {
puts("filename error");
exit(-1);
}
fseek(f1, 0, SEEK_END);
int len1 = ftell(f1);
fseek(f1, 0, SEEK_SET);
int fd1 = fileno(f1);
unsigned char *mp1 = mmap(NULL, len1, PROT_READ, MAP_SHARED, fd1, 0); //必须要读,写
//---------读量化表-------------------------------
char lh00[64] = {}; //提取量化表
char lh10[64] = {};
for (int a = 0; a < len1; a++) {
if ((mp1[a] == 0xff) && (mp1[a + 1] == 0xdb) && (mp1[a + 2] == 0)) {
for (int b = 0; b < 65; b++) {
if (mp1[a + b + 4] == 0) {
memcpy(lh00, &(mp1[a + b + 5]), 64);
}
if (mp1[a + b + 4] == 1) {
memcpy(lh10, &(mp1[a + b + 5]), 64);
}
}
// printf("\n");
}
}
//---------------------------------------------------------------------------
FILE *f = fopen(filename, "rb"); //如用mmap 必须以读写方式打开文件
if (f == NULL) {
puts("filename error");
exit(-1);
}
fseek(f, 0, SEEK_END);
int len_file = ftell(f);
fseek(f, 0, SEEK_SET);
int fd = fileno(f);
unsigned char *mp = mmap(NULL, len_file, PROT_READ, MAP_SHARED, fd, 0); //必须要读,写
int width_pic = 1280;
int heigth_pic = 720;
//out:1.文件总长度 len_file
// 2.图片宽度 1280 width_pic
// 3.图片高度 720 heigth_pic
// 4.图片数据 *mp
//--------------------------------------------------------
//因为yuv422数据是4个字节生成2个像素点,所以图片的width*heigth*2=len_file
//摄像头输出的分辨率图片宽度×2都是8的倍数,高度X2也是8的倍数。所以yuv数据都不用补列。最多补文件末尾的空字节
//摄像头的分辨率末尾数X2=0,8,6,4,2,就是8的倍数
// 1.----------检查yuv文件长度末尾是否有空字节,有,补0-------------------
if ((width_pic * heigth_pic * 2) != len_file) {
memset(&mp[len_file], 0, (width_pic * heigth_pic * 2 - len_file));
}
// 2.----------取16*8--------------------------------------
//YUV422 字节排列:[0]=Y0 [1]=U0 [2]=Y1 [3]=V0 [4]=Y2 [5]=U1 [6]=Y3 [7]=V1 4个Y 2个U 2个V
//所以取16个字节的yuv 数据,含8个y ,4个u,4个v
unsigned char (*i_mp)[width_pic] = (unsigned char (*)[width_pic])mp;
int m = 0; // 行 取1个(0,0)开始的16×8 块
int n = 0; //列
int heigth = heigth_pic; //行
int width = width_pic; //列
int fheigth = 8;
int fwidth = 16;
unsigned char o[8][16] = {}; //取出16×8的块
if ((m + fheigth) > heigth) {
puts("fheigth error");
exit(-1);
}
if ((n + fwidth) > width) {
puts("fwidth error");
exit(-1);
}
for (int a = 0; a < fheigth; a++) {
for (int b = 0; b < fwidth; b++) {
o[a][b] = i_mp[a + m][b + n];
}
}
munmap(mp, len_file);
//----------分离Y---------------------
char y[8][8] = {};
for (int a = 0; a < 8; a++) {
for (int b = 0; b < 8; b++) {
y[a][b] = o[a][2*b]-128;
}
}
/* char y1[8][8]={{140,144,147,140,140,155,179,179},//验证程序数据
{144,152,140,147,140,148,167,179},
{152,155,136,167,163,162,152,172},
{168,145,156,160,152,155,136,160},
{162,148,156,148,140,136,147,162},
{147,167,140,155,155,140,136,162},
{136,156,123,167,162,144,140,147},
{148,155,136,155,152,147,147,136}
};
char y[8][8]={};
for(int a=0;a<8;a++){
for(int b=0;b<8;b++){
y[b][a]=y1[b][a]-128;
}
}*/
//----------分离U-----------------
char u[8][8] = {};
memset(&u, 0, 64); //补0
for (int a = 0; a < 8; a++) {
for (int b = 0; b < 8; b++) {
if ((4 * b + 1) <= 16) {
u[a][b] = o[a][4 * b + 1] - 128;
}
}
}
//-----------分离v-----------------
char v[8][8] = {};
memset(&v, 0, 64); //补0
for (int a = 0; a < 8; a++) {
for (int b = 0; b < 8; b++) {
if ((4 * b + 3) <= 16) {
v[a][b] = o[a][4 * b + 3] - 128;
}
}
}
//--------------FDCY Y- U V----------------------------
int y_fdct[8][8] = {};
fdct(y,y_fdct);
int u_fdct[8][8] = {};
fdct(u, u_fdct);
int v_fdct[8][8] = {};
fdct(v, v_fdct);
//----------------量化 Y U V -----------------------------------
//借用成品jpg图片量化表,lh0,lh1
char (*lh0)[8] = (char (*)[8])lh00;
char (*lh1)[8] = (char (*)[8])lh10;
/* char lh0[8][8]={ // 验证数据用量化表
{3,5,7,9,11,13,15,17},
{5,7,9,11,13,15,17,19},
{7,9,11,13,15,17,19,21},
{9,11,13,15,17,19,21,23},
{11,13,15,17,19,21,23,25},
{13,15,17,19,21,23,25,27},
{15,17,19,21,23,25,27,29},
{17,19,21,23,25,27,29,31}
};*/
int y_lh[8][8] = {};
int u_lh[8][8] = {};
int v_lh[8][8] = {};
lh(y_fdct, lh0, y_lh);
lh(u_fdct, lh1, u_lh);
lh(v_fdct, lh1, v_lh);
//---------Z排序--------------------------
int y_z[64] = {};
int u_z[64] = {};
int v_z[64] = {};
zz(y_lh, y_z);
zz(u_lh, u_z);
zz(v_lh, v_z);
//--------去0-------------------------
int y_0[64][2] = {};
int u_0[64][2] = {};
int v_0[64][2] = {};
int len_y_0 = q0(y_z, y_0);
int len_u_0 = q0(u_z, u_0);
int len_v_0 = q0(v_z, v_0);
//-----整理规范------------------------
int y_zl[64][2]={}; //定义是必须指定数组内存大小,下标不能用变量,64是此数组的最大值
int u_zl[64][2]={};
int v_zl[64][2]={};
int len_y_zl=zl(len_y_0,y_0,y_zl);
int len_u_zl=zl(len_u_0,u_0,u_zl);
int len_v_zl=zl(len_v_0,v_0,v_zl);
//---------------------------------------------------------------------
for (int a = 0; a <len_y_zl;a++) {
for (int b = 0; b < 2; b++) {
printf("%d ,",y_zl[a][b]);
}
printf("\n");
}
return 0;
}