您的位置：首页 > 其它

FFMPEG编译使用以及FFMPEG在编码转换方面的应用

2014-10-27 09:59 344 查看

遇到一篇好文章，讲解了swscale库的使用详情。转载只是为了自己容易找到原文的位置，请各位同学到原文地址查看，谢谢。

转自：http://blackhuman.blogcn.com/archives/176

为了将YUV420编码转化成RGB444编码，并且可以保持很高的计算速度。我最终盯上了FFMPEG这个开源库。FFMPEG有很多功能，我为了解决上面提到的那个问题，只使用了sws_scale这一个函数。下面首先说一下这个函数的用法，然后在说下如何自己从源代码编译FFMPEG。

sws_scale函数的作用是图像缩放和图像空间编码转换，它包含在头文件<libswscale/swscale.h>中，由于是c函数，所以在c++编译器中调用时，需要使用extern "C" 来声明这个头文件，如下。

extern "C" {

#include <libswscale/swscale.h>

}

#pragma comment(lib,"swscale.lib")

sws_scale函数原型如下（下方图）。其中*context是一个指向SwsContext结构的指针，这个结构由sws_getContext函数生成，下面会提到。srcSlice应该指向源数据，我这里是指向一块YUV420编码数组的开头的。srcStride表示的是每个平面矩阵的行宽，比如YUV420编码分三个平面，Y平面、U平面和V平面。Y平面是一个W*H的矩阵（W是图像宽，H是图像高），所以Y平面行宽为W，即strStride[0]=W；U平面和V平面分别是一个(W/2)*(H/2)的矩阵（这是YUV420编码决定的），所以U和V平面的行宽为W/2，那么strStride[1]=W/2，strStride[2]=H/2；由于在YUV420下，第四个平面没有任何数据，所以strStride[3]=0。srcSliceY为0即可。srcSliceH为图像高度H。dst是一个指向目标数组的指针，这个数组将会存放转换后的RGB444数据，这个数据块需要事先分配好。dstStride表示目的数据格式中每个平面矩阵的行宽，由于RGB444需要交错通道排列，所以只需要一个平面，这样，这个平面的行宽就位W*3，即dstStride[0]=W*3,dstStride[1]=0,dstStride[2]=0,dstStride[3]=0。上面所有的数组都需要事先分配空间。下图为我的调用方法。

sws_scale函数原型

int sws_scale(

struct SwsContext *context,

const uint8_t* const srcSlice[],

const int srcStride[],

int srcSliceY,

int srcSliceH,

uint8_t* const dst[],

const int dstStride[]

);

我的调用方法

sws_scale(

img_convert_ctx,

Decdata,

srcStride,

0,

IMG_HEIGHT,

Encdata,

dstStride

);

下面说说那个swsContext结构体，这个结构体可由sws_getContext函数生成。sws_getContext函数原型如下（下图）。srcW为源数据图像宽，srcH为源数据图像高。srcFormat表示源数据图像格式，其中用PIX_FMT_YUV420P表示YUV420格式，还有其他表示方法，大家可以在FFMPEG对应头文件的声明中找到他们。dstW为目的数据图像宽，dstH为目的数据图像高。dstFormat表示目的数据图像格式，我需要RGB，所以用PIX_FMT_RGB24赋值。flags为SWS_BICUBIC即可，srcFilter,dstFilter,param为NULL即可。下图为我的调用方法。

sws_getContext函数原型

struct SwsContext *sws_getContext(

int srcW,

int srcH,

enum PixelFormat srcFormat,

int dstW,

int dstH,

enum PixelFormat dstFormat,

int flags,

SwsFilter *srcFilter,

SwsFilter *dstFilter,

const double *param

);

我的调用方法

SwsContext* img_convert_ctx = sws_getContext(

IMG_WIDTH,

IMG_HEIGHT,

PIX_FMT_YUV420P,

IMG_WIDTH,

IMG_HEIGHT,

(PixelFormat)PIX_FMT_RGB24,

SWS_BICUBIC,

NULL,

NULL,

NULL

);

这样，我就从Encdata中得到了RGB交错通道图像，这样，这个图像就可以放入OpenCV的IplImage结构中处理了。

下面再谈谈FFMPEG的编译。从FFMPEG项目主页（http://www.ffmpeg.org/releases/ffmpeg-0.6.3.tar.bz2）获得FFMPEG源码，并使用MinGW来进行编译。这里有必要说一下MinGW，我们可以把MinGW看成是一个编译环境，里面包含了一个叫做MSys的模拟器，MSys可以在windows中进行linux的类shell操作（像Cygwin）。反正目前编译FFMPEG只有这一种方法，照着做就行了。MinGW从其代码托管空间下载，但是一般下载的都是一个小文件，打开安装后会自动下载剩余部分。

经过漫长的等待后MinGW下载并安装好了，就可以使用了。运行.\MinGW32\MSYS\1.0\msys.bat进入控制台，在控制台中进入你FFMPEG源代码安装路径。接着就是标准的编译过程了。

$ ./configure --enable-memalign-hack --enable-static --enable-shared --enable-avfilter-lavf

$make

$make install

然后又是漫长的等待，成功之后，各种文件就会出现在.\MinGW\msys\1.0\local中了。

附上一些参考网站：

ffmpeg编译教程
http://www.cnblogs.com/Jerry-Chou/archive/2011/03/29/1998564.html http://zhaostudy2.blog.163.com/blog/static/13535020520110179271153/
ffmpeg编译好的版本直接下载
http://www.ffmpeg.com.cn/index.php/%E9%A6%96%E9%A1%B5
YUV到RGB的转换方法
http://www.rosoo.net/a/201006/9661.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航