您的位置:首页 > 其它

FFMPEG编译使用以及FFMPEG在编码转换方面的应用

2014-10-27 09:59 344 查看
遇到一篇好文章,讲解了swscale库的使用详情。转载只是为了自己容易找到原文的位置,请各位同学到原文地址查看,谢谢。

转自:http://blackhuman.blogcn.com/archives/176

为了将YUV420编码转化成RGB444编码,并且可以保持很高的计算速度。我最终盯上了FFMPEG这个开源库。FFMPEG有很多功能,我为了解决上面提到的那个问题,只使用了sws_scale这一个函数。下面首先说一下这个函数的用法,然后在说下如何自己从源代码编译FFMPEG。

sws_scale函数的作用是图像缩放和图像空间编码转换,它包含在头文件<libswscale/swscale.h>中,由于是c函数,所以在c++编译器中调用时,需要使用extern "C" 来声明这个头文件,如下。

extern "C" {

#include <libswscale/swscale.h>

}

#pragma comment(lib,"swscale.lib")

sws_scale函数原型如下(下方图)。其中*context是一个指向SwsContext结构的指针,这个结构由sws_getContext函数生成,下面会提到。srcSlice应该指向源数据,我这里是指向一块YUV420编码数组的开头的。srcStride表示的是每个平面矩阵的行宽,比如YUV420编码分三个平面,Y平面、U平面和V平面。Y平面是一个W*H的矩阵(W是图像宽,H是图像高),所以Y平面行宽为W,即strStride[0]=W;U平面和V平面分别是一个(W/2)*(H/2)的矩阵(这是YUV420编码决定的),所以U和V平面的行宽为W/2,那么strStride[1]=W/2,strStride[2]=H/2;由于在YUV420下,第四个平面没有任何数据,所以strStride[3]=0。srcSliceY为0即可。srcSliceH为图像高度H。dst是一个指向目标数组的指针,这个数组将会存放转换后的RGB444数据,这个数据块需要事先分配好。dstStride表示目的数据格式中每个平面矩阵的行宽,由于RGB444需要交错通道排列,所以只需要一个平面,这样,这个平面的行宽就位W*3,即dstStride[0]=W*3,dstStride[1]=0,dstStride[2]=0,dstStride[3]=0。上面所有的数组都需要事先分配空间。下图为我的调用方法。

sws_scale函数原型

int sws_scale(

struct SwsContext *context,

const uint8_t* const srcSlice[],

const int srcStride[],

int srcSliceY,

int srcSliceH,

uint8_t* const dst[],

const int dstStride[]

);

我的调用方法

sws_scale(

img_convert_ctx,

Decdata,

srcStride,

0,

IMG_HEIGHT,

Encdata,

dstStride

);

下面说说那个swsContext结构体,这个结构体可由sws_getContext函数生成。sws_getContext函数原型如下(下图)。srcW为源数据图像宽,srcH为源数据图像高。srcFormat表示源数据图像格式,其中用PIX_FMT_YUV420P表示YUV420格式,还有其他表示方法,大家可以在FFMPEG对应头文件的声明中找到他们。dstW为目的数据图像宽,dstH为目的数据图像高。dstFormat表示目的数据图像格式,我需要RGB,所以用PIX_FMT_RGB24赋值。flags为SWS_BICUBIC即可,srcFilter,dstFilter,param为NULL即可。下图为我的调用方法。

sws_getContext函数原型

struct SwsContext *sws_getContext(

int srcW,

int srcH,

enum PixelFormat srcFormat,

int dstW,

int dstH,

enum PixelFormat dstFormat,

int flags,

SwsFilter *srcFilter,

SwsFilter *dstFilter,

const double *param

);

我的调用方法

SwsContext* img_convert_ctx = sws_getContext(

IMG_WIDTH,

IMG_HEIGHT,

PIX_FMT_YUV420P,

IMG_WIDTH,

IMG_HEIGHT,

(PixelFormat)PIX_FMT_RGB24,

SWS_BICUBIC,

NULL,

NULL,

NULL

);

这样,我就从Encdata中得到了RGB交错通道图像,这样,这个图像就可以放入OpenCV的IplImage结构中处理了。

下面再谈谈FFMPEG的编译。从FFMPEG项目主页(http://www.ffmpeg.org/releases/ffmpeg-0.6.3.tar.bz2)获得FFMPEG源码,并使用MinGW来进行编译。这里有必要说一下MinGW,我们可以把MinGW看成是一个编译环境,里面包含了一个叫做MSys的模拟器,MSys可以在windows中进行linux的类shell操作(像Cygwin)。反正目前编译FFMPEG只有这一种方法,照着做就行了。MinGW从其代码托管空间下载,但是一般下载的都是一个小文件,打开安装后会自动下载剩余部分。

经过漫长的等待后MinGW下载并安装好了,就可以使用了。运行.\MinGW32\MSYS\1.0\msys.bat进入控制台,在控制台中进入你FFMPEG源代码安装路径。接着就是标准的编译过程了。

$ ./configure --enable-memalign-hack --enable-static --enable-shared --enable-avfilter-lavf

$make

$make install

然后又是漫长的等待,成功之后,各种文件就会出现在.\MinGW\msys\1.0\local中了。

附上一些参考网站:

ffmpeg编译教程
http://www.cnblogs.com/Jerry-Chou/archive/2011/03/29/1998564.html http://zhaostudy2.blog.163.com/blog/static/13535020520110179271153/
ffmpeg编译好的版本直接下载
http://www.ffmpeg.com.cn/index.php/%E9%A6%96%E9%A1%B5
YUV到RGB的转换方法
http://www.rosoo.net/a/201006/9661.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: