二维DCT变换
2016-03-03 16:48
246 查看
出处:https://wuyuans.com/2012/11/dct2/
DCT,又叫离散预先变换,它的第二种类型,经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中,一般只有左上角的数值是非零的,也就是能量都集中在离散余弦变换后的直流和低频部分。
1,一维DCT变换
我们首先看着一维的DCT变换,这是二维的基础。一维的DCT变换共有8种,其中最实用的是第二种形式,公式如下:
dct1 其中c(u)是加上去一个系数,为了能使DCT变换矩阵成为正交矩阵,在后面二维变换将看到他的作用。N是f(x)的总数。相比其他几种形式,他的运算还是比较简单的,因此也用的比较广
2,二维DCT变换
二维DCT变换是在一维的基础上再进行一次DCT变换,这个比较好理解,直接看公式:
这里只讨论两个N相等的情况,也就是数据是方阵的形式,在实际应用中对不是方阵的数据都是先补齐再进行变换的。为了matlab仿真方便点,写成矩阵形式:
用matlab来模拟一下,使用随机生成的4x4矩阵作为输入,程序如下:
Y是使用上面的公式进行变换,YY是用matlab自带的dct2函数变换,结果是是:
可以看出Y和YY的结果是一样的,这也进一步验证了上面的公式是正确的。由于X是随机生成的,相关性很小,变换后的结果比较乱;如果是信号或图像这样相关性比较大的数据的话,数值会集中在左上角,右下角一般都是零,再使用“之”字型扫描得到数据流会包含很多连续的零,编码后数据量会非常小,这就是DCT变换带来的好处。
3.二维DCT反变换
DCT逆变换的公式如下
矩阵形式可以由正变换的公式直接推出来,因为在A中加了c(i)这个系数,使得A成为了正交矩阵,所以我们就可以这样做:
在用matlab来验证是否能反变换出原来的数据:
X使用的是上面正变换用的数据,运行后得到的X1为:
和X完全相等。在实际进行编码的时候,比如JPEG压缩的时候,只会对Y左上角的数据进行传输,所以解码出来的内容不会完全和原来的相同。
4.整数DCT变换
说道DCT就顺便提一下x264中的整数DCT变换,整数DCT变换是以DCT变换为基础的,为了减少计算量做的一些调整,下面我写一下整数DCT变换公式的大致推导过程:
这样在对大括号部分进行计算时就都是加法和减法了,而且在精度上没有太大降低。在x264实际编码中,变换和量化是一起进行的,使得编码速度有了很大的提高。
作者:wuyuan 本文来自Wuyuan’s Blog 转载请注明,谢谢! 文章地址: http://wuyuans.com/2012/11/dct2
DCT,又叫离散预先变换,它的第二种类型,经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中,一般只有左上角的数值是非零的,也就是能量都集中在离散余弦变换后的直流和低频部分。
1,一维DCT变换
我们首先看着一维的DCT变换,这是二维的基础。一维的DCT变换共有8种,其中最实用的是第二种形式,公式如下:
dct1 其中c(u)是加上去一个系数,为了能使DCT变换矩阵成为正交矩阵,在后面二维变换将看到他的作用。N是f(x)的总数。相比其他几种形式,他的运算还是比较简单的,因此也用的比较广
2,二维DCT变换
二维DCT变换是在一维的基础上再进行一次DCT变换,这个比较好理解,直接看公式:
这里只讨论两个N相等的情况,也就是数据是方阵的形式,在实际应用中对不是方阵的数据都是先补齐再进行变换的。为了matlab仿真方便点,写成矩阵形式:
用matlab来模拟一下,使用随机生成的4x4矩阵作为输入,程序如下:
clear; clc; X=round(rand(4)*100);%随机生成的数据 A=zeros(4);%变换矩阵 for i=0:3 for j=0:3 if i==0 a=sqrt(1/4); else a=sqrt(2/4); end A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4); end end Y=A*X*A';%DCT变换 YY=dct2(X);%用matlab中的函数进行DCT变换
Y是使用上面的公式进行变换,YY是用matlab自带的dct2函数变换,结果是是:
X = 61 19 50 20 82 26 61 45 89 90 82 43 93 59 53 97 Y = 242.5000 32.1613 22.5000 33.2212 -61.8263 7.9246 -10.7344 30.6881 -16.5000 -14.7549 22.5000 -6.8770 8.8322 16.6881 -35.0610 -6.9246 YY = 242.5000 32.1613 22.5000 33.2212 -61.8263 7.9246 -10.7344 30.6881 -16.5000 -14.7549 22.5000 -6.8770 8.8322 16.6881 -35.0610 -6.9246
可以看出Y和YY的结果是一样的,这也进一步验证了上面的公式是正确的。由于X是随机生成的,相关性很小,变换后的结果比较乱;如果是信号或图像这样相关性比较大的数据的话,数值会集中在左上角,右下角一般都是零,再使用“之”字型扫描得到数据流会包含很多连续的零,编码后数据量会非常小,这就是DCT变换带来的好处。
3.二维DCT反变换
DCT逆变换的公式如下
矩阵形式可以由正变换的公式直接推出来,因为在A中加了c(i)这个系数,使得A成为了正交矩阵,所以我们就可以这样做:
在用matlab来验证是否能反变换出原来的数据:
clear; clc; X=[ 61 19 50 20 82 26 61 45 89 90 82 43 93 59 53 97]; A=zeros(4); for i=0:3 for j=0:3 if i==0 a=sqrt(1/4); else a=sqrt(2/4); end A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4); end end Y=A*X*A'; X1=A'*Y*A;
X使用的是上面正变换用的数据,运行后得到的X1为:
X1 = 61.0000 19.0000 50.0000 20.0000 82.0000 26.0000 61.0000 45.0000 89.0000 90.0000 82.0000 43.0000 93.0000 59.0000 53.0000 97.0000
和X完全相等。在实际进行编码的时候,比如JPEG压缩的时候,只会对Y左上角的数据进行传输,所以解码出来的内容不会完全和原来的相同。
4.整数DCT变换
说道DCT就顺便提一下x264中的整数DCT变换,整数DCT变换是以DCT变换为基础的,为了减少计算量做的一些调整,下面我写一下整数DCT变换公式的大致推导过程:
这样在对大括号部分进行计算时就都是加法和减法了,而且在精度上没有太大降低。在x264实际编码中,变换和量化是一起进行的,使得编码速度有了很大的提高。
作者:wuyuan 本文来自Wuyuan’s Blog 转载请注明,谢谢! 文章地址: http://wuyuans.com/2012/11/dct2
相关文章推荐
- 构建微服务-第一章-什么是微服务_003弹性和可伸缩性
- 公私钥加密机制
- 自动化测试之路——EMMA在java代码覆盖率自动化测试中的应用(一)
- iOS打电话功能
- XPATH
- oracle数据库dblink创建示例
- 使用EXP进行备份时EXP-00091报错解决办法
- Win32工程中使用MFCdll的解决方法
- 中国人民大学2016年硕士研究生复试基本要求
- Leetcode171. Excel Sheet Column Number
- 经典排序算法
- 老李秘技:loadrunner11是否还支持dblib协议?
- POJ 2940 Wine Trading in Gergovia【贪心】
- 手机版制作H5页面免费工具大集合
- Java 完美判断中文字符
- 【转】Google推荐的图片加载库Glide介绍
- Qt发布打包工具 windeployqt
- Eclipse使用Maven创建Web时错误:Could not resolve archetype org.apache.maven.archetypes:maven-archetype-webap
- java中static{}语句块详解
- 新建cocos2d-xproject