x265-1.8版本-common/slice.h注释
2016-01-30 21:27
393 查看
注:问号以及未注释部分 会在x265-1.9版本内更新
/***************************************************************************** * Copyright (C) 2015 x265 project * * Authors: Steve Borho <steve@borho.org> * * This program is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 2 of the License, or * (at your option) any later version. * * This program is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with this program; if not, write to the Free Software * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02111, USA. * * This program is also available under a commercial proprietary license. * For more information, contact us at license @ x265.com. *****************************************************************************/ #ifndef X265_SLICE_H #define X265_SLICE_H #include "common.h" namespace X265_NS { // private namespace class Frame; class PicList; class MotionReference; enum SliceType { B_SLICE, P_SLICE, I_SLICE }; struct RPS//RPS(reference picture set) 在slice中被引用 { int numberOfPictures; //参考帧列表中的参考数目 int numberOfNegativePictures;//前向参考个数 int numberOfPositivePictures;//后向参考帧个数 int poc[MAX_NUM_REF_PICS];//存储当前帧前面已经编码可参考的参考帧 初始化为0 (按照编码顺序排序 倒序) int deltaPOC[MAX_NUM_REF_PICS];//参考帧poc减去存储当前帧poc的值 按照 远 近 (当前帧) 近 远的次序排序 bool bUsed[MAX_NUM_REF_PICS];//记录参考帧列表对应位置帧是否可用 (如果当前帧是关键帧,则全为不可用) //如编码次序:0 4 2 1 3 8 6 5 7 12 10 9 11 //则编码11时, poc存储为: 10 12 6 8 //deltapoc 存储为: -5 -3 -1 12 (排序为 6 8 10 12) RPS()//初始化 : numberOfPictures(0) , numberOfNegativePictures(0) , numberOfPositivePictures(0) { memset(deltaPOC, 0, sizeof(deltaPOC)); memset(poc, 0, sizeof(poc)); memset(bUsed, 0, sizeof(bUsed)); } /** 函数功能 : 将RPS列表中的deltaPOC和bused 按照 远 近 (当前帧) 近 远的次序排序 /* 调用范围 : 只在DPB::computeRPS函数中被调用 * 返回值 : null **/ void sortDeltaPOC(); }; namespace Profile { /*H.265/HEVC标准中提出了三种档次,分别是Main、Main 10和Main Still Picture **/ enum Name //档次名称 { NONE = 0, //不应用 MAIN = 1, //支持每像素8比特的位深、4:2:0的采样格式,是最常见的档次 MAIN10 = 2, //10比特位深,有助于提高视频质量。主要应用于消费电子领域。 MAINSTILLPICTURE = 3,//支持单个静止图像 不支持帧间预测 MAINREXT = 4, //全I帧 其它档次 HIGHTHROUGHPUTREXT = 5 //不应用 }; } namespace Level { /* H.265/HEVC 标准中定义了两个层和13级 x265:level 大于等于 Level::LEVEL5时,CTB必须大于等于32 x265:param.maxNumReferences + vps.numReorderPics; 全部参考帧个数不能大于8 **/ enum Tier //层 { /* 两个层分别是 Main Tier和High Tier 4和4以上的8个Level支持High Tier Tier按其最高比特率来处理应用问题, Main tier适用于大多数应用,High Tier用于高需求应用。 符合某一Tier/Level 的解码器能够解码当前以及比当前Tier/Level低的所有码流 **/ MAIN = 0, HIGH = 1, }; enum Name//级 { /*同一个Level实际上就是一套对编码比特流的一系列编码参数的限制。 H.265/HEVC 的13个等级支持从QCIF到8K多种分辨率的图像。 图像宽高受到该级别定义参数MaxLumaPS的限制—图像的宽和高均小于等于8倍的MaxLumaPS再开方。此外,Level 还约束了每幅图像中垂直和水平方向Tile的最大数量,以及每秒最大的Tile数量。 **/ NONE = 0,//不用 LEVEL1 = 30, //以下为13个等级 LEVEL2 = 60, LEVEL2_1 = 63, LEVEL3 = 90, LEVEL3_1 = 93, LEVEL4 = 120, LEVEL4_1 = 123, LEVEL5 = 150, LEVEL5_1 = 153, LEVEL5_2 = 156, LEVEL6 = 180, LEVEL6_1 = 183, LEVEL6_2 = 186, LEVEL8_5 = 255,//无损压缩 }; } struct ProfileTierLevel//用途:存储? 只存在于VPS中 { bool tierFlag; //当前层次等级 MAIN HIGH bool progressiveSourceFlag; bool interlacedSourceFlag; bool nonPackedConstraintFlag; bool frameOnlyConstraintFlag; /* MAIN : MAIN、 MAIN10 置为true 其它为false MAIN10并且8位 : MAIN、 MAIN10 置为true 其它为false MAINSTILLPICTURE: MAIN、 MAIN10 MAINSTILLPICTURE 置为true 其它为false MAIN10 : MAIN10 置为true 其它为false MAINREXT : MAINREXT 置为true 其它为false **/ bool profileCompatibilityFlag[32];//当general_profile_space 值等于0时,该语法元素取值为1,表示当前CVS编码过程使用的档次的ID为j 如采用MAIN 则profileCompatibilityFlag[MAIN]=1 其它为0 coded video sequence (CVS) bool intraConstraintFlag;//是否全I帧 bool onePictureOnlyConstraintFlag;//当前需要编码的是否只有一帧 bool lowerBitRateConstraintFlag;//用途????置为true 暂不应用 int profileIdc; //当前编码所处的档次 MAIN MAIN10 MAINSTILLPICTURE等 int levelIdc; //当前level等级 如Level::LEVEL1等 uint32_t minCrForLevel;//当前的最小压缩比 CR 表示 CompressionRatio uint32_t maxLumaSrForLevel;//该等级每帧最大亮度像素个数 uint32_t bitDepthConstraint;//像素位宽 8 10 12 int chromaFormatConstraint;//图像格式 默认为420 }; struct HRDInfo { uint32_t bitRateScale; uint32_t cpbSizeScale; uint32_t initialCpbRemovalDelayLength; uint32_t cpbRemovalDelayLength; uint32_t dpbOutputDelayLength; uint32_t bitRateValue; uint32_t cpbSizeValue; bool cbrFlag; HRDInfo() : bitRateScale(0) , cpbSizeScale(0) , initialCpbRemovalDelayLength(1) , cpbRemovalDelayLength(1) , dpbOutputDelayLength(1) , cbrFlag(false) { } }; struct TimingInfo { uint32_t numUnitsInTick; uint32_t timeScale; }; struct VPS { uint32_t maxTempSubLayers;//最大时域层个数 param.bEnableTemporalSubLayers ? 2 : 1 uint32_t numReorderPics;//需要重排序的帧数 值:(param.bBPyramid && param.bframes > 1) ? 2 : !!param.bframes; uint32_t maxDecPicBuffering;//解码需要的buffer大小: 值 X265_MIN(MAX_NUM_REF, X265_MAX(vps.numReorderPics + 2, (uint32_t)param.maxNumReferences) + vps.numReorderPics); uint32_t maxLatencyIncrease; HRDInfo hrdParameters; ProfileTierLevel ptl; }; struct Window { bool bEnabled; int leftOffset; int rightOffset; int topOffset; int bottomOffset; Window() { bEnabled = false; } }; struct VUI { bool aspectRatioInfoPresentFlag; int aspectRatioIdc; int sarWidth; int sarHeight; bool overscanInfoPresentFlag; bool overscanAppropriateFlag; bool videoSignalTypePresentFlag; int videoFormat; bool videoFullRangeFlag; bool colourDescriptionPresentFlag; int colourPrimaries; int transferCharacteristics; int matrixCoefficients; bool chromaLocInfoPresentFlag; int chromaSampleLocTypeTopField; int chromaSampleLocTypeBottomField; Window defaultDisplayWindow; bool frameFieldInfoPresentFlag; bool fieldSeqFlag; bool hrdParametersPresentFlag; HRDInfo hrdParameters; TimingInfo timingInfo; }; struct SPS { int chromaFormatIdc; // use param uint32_t picWidthInLumaSamples; //图像的宽度 use param uint32_t picHeightInLumaSamples; //图像的高度 use param uint32_t numCuInWidth; //有多少CTU列 uint32_t numCuInHeight; //有多少CTU行 uint32_t numCUsInFrame; //一帧CTU个数 uint32_t numPartitions; uint32_t numPartInCUSize;//CTU中一边有多少4x4块 默认为16(64有16个4) int log2MinCodingBlockSize; int log2DiffMaxMinCodingBlockSize; uint32_t quadtreeTULog2MaxSize; uint32_t quadtreeTULog2MinSize;//最小TU的值 (一般默认为4x4,值为2) uint32_t quadtreeTUMaxDepthInter; // use param uint32_t quadtreeTUMaxDepthIntra; // use param bool bUseSAO; // use param bool bUseAMP; // use param uint32_t maxAMPDepth; uint32_t maxTempSubLayers; // max number of Temporal Sub layers uint32_t maxDecPicBuffering; // 继承VPS值 解码需要的buffer大小: 值 X265_MIN(MAX_NUM_REF, X265_MAX(vps.numReorderPics + 2, (uint32_t)param.maxNumReferences) + vps.numReorderPics); these are dups of VPS values uint32_t maxLatencyIncrease; int numReorderPics; bool bUseStrongIntraSmoothing; //当前intra参考像素是否需要强滤波 use param bool bTemporalMVPEnabled; Window conformanceWindow; VUI vuiParameters; }; struct PPS { uint32_t maxCuDQPDepth; int chromaQpOffset[2]; //分别存储cb、cr量化参数相对于亮度量化参数的偏移 默认为0// use param bool bUseWeightPred; // 当前是否应用P帧加权预测use param bool bUseWeightedBiPred; // 当前是否应用B帧加权预测use param bool bUseDQP; bool bConstrainedIntraPred; // 表示帧内预测是否受限,即是否允许使用采用帧间预测模式的邻近块信息进行帧内预测 默认否(不受限制) use param bool bTransquantBypassEnabled; // Indicates presence of cu_transquant_bypass_flag in CUs. bool bTransformSkipEnabled; // 是否应用transformSkip 在4x4才应用 use param bool bEntropyCodingSyncEnabled; // use param bool bSignHideEnabled; // use param bool bDeblockingFilterControlPresent; bool bPicDisableDeblockingFilter; int deblockingFilterBetaOffsetDiv2; int deblockingFilterTcOffsetDiv2; }; struct WeightParam //存储加权帧的加权信息 用于slice类 { //加权为 w*ref + offset ref为参考帧所有像素值 //其中w为: inputWeight/(1<<log2WeightDenom) //其中offset为:inputOffset //权重系数w一般在 √(原始帧方差/参考帧方差) 周围搜索 // Explicit weighted prediction parameters parsed in slice header, bool bPresentFlag; //是否加权 uint32_t log2WeightDenom; //权重系数左移位个数(为了保证精度) int inputWeight; //权重系数 整个的权重系数等于:(1<<(7-log2WeightDenom)) + inputWeight 目前的权重系数为guessScale * (1<<denom)+0.5f = (1<<(7-log2WeightDenom)) + inputWeight 其中guessScale :√(原始帧方差/参考帧方差) int inputOffset; //offset信息 整帧所有像素偏移值 /* makes a non-h265 weight (i.e. fix7), into an h265 weight */ /** 函数功能 :设置相应数据 /* 调用范围 :只在在LookaheadTLD::weightsAnalyse和weightAnalyse函数中被调用 * \参数 w :LookaheadTLD::weightsAnalyse: (int)(guessScale * 128 + 0.5f) weightAnalyse:guessScale * (1<<denom)+0.5f denom 一般等于7 * \参数 o :LookaheadTLD::weightsAnalyse: 0 weightAnalyse:0 * \参数 denom :LookaheadTLD::weightsAnalyse: 7 weightAnalyse:一般为7 * \参数 bNormalize :LookaheadTLD::weightsAnalyse: trueweightAnalyse:list0为true list1 为false * \返回 :NULL */ void setFromWeightAndOffset(int w, int o, int denom, bool bNormalize) { inputOffset = o; log2WeightDenom = denom; inputWeight = w; while (bNormalize && log2WeightDenom > 0 && (inputWeight > 127)) { log2WeightDenom--; inputWeight >>= 1; } inputWeight = X265_MIN(inputWeight, 127); } }; //设置WeightParam类数据 #define SET_WEIGHT(w, b, s, d, o) \ { \ (w).inputWeight = (s); \ (w).log2WeightDenom = (d); \ (w).inputOffset = (o); \ (w).bPresentFlag = (b); \ } class Slice { public: const SPS* m_sps; //指向encoder的SPS const PPS* m_pps; //指向encoder的PPS WeightParam m_weightPredTable[2][MAX_NUM_REF][3]; // 参考帧加权状态信息 (每个list的第一帧分析加权与否,其它不加权) [list][refIdx][0:Y, 1:U, 2:V] MotionReference (*m_mref)[MAX_NUM_REF + 1]; //指向FrameEncoder中对应的参考帧信息 RPS m_rps; NalUnitType m_nalUnitType; SliceType m_sliceType; //在DPB::prepareEncode函数确定slice类型:B_SLICE,P_SLICE,I_SLICE int m_sliceQp;//存储经过rateControlStart估计后的当前帧的量化参数 int m_poc; //当前POC int m_lastIDR; bool m_bCheckLDC; // 目前x265: B帧 false 其它 ture 指的是low-delay mode??? TODO: is this necessary? bool m_sLFaseFlag; // 应用????????表示环路滤波是否可以越过当前slice的上边界和左边界 初始化为ture (只在prepareEncode计算过一次然后就写码流) loop filter boundary flag bool m_colFromL0Flag; // ?????用于时域MV预测的collocated图像来自参考图像列表List0还是List1 目前x265: B帧 false 其它 ture collocated picture from List0 or List1 flag uint32_t m_colRefIdx; // ?????用于时域MV预测的collocated图像的参考索引号 ,一直为0,没被修改过never modified //x265中没有应用长期参考帧 x265中List0 全为前向参考帧 List1全为后向参考帧 //List0 存储方式:按照距离当前帧由近到远排序 //List1 存储方式:按照距离当前帧由近到远排序 int m_numRefIdx[2];//分别为L0的最大帧数(配置的配置的参考帧最大数目与实际前向帧数取最小值) L1 的最大帧数(2或者1 与 实际后向帧数取最小值) 分别为前向帧和后向帧 Frame* m_refPicList[2][MAX_NUM_REF + 1];//存储List帧指针(数据存放在dpb中的m_picList中)setRefPicList函数设定 int m_refPOCList[2][MAX_NUM_REF + 1];//存储List帧poc setRefPicList函数设定 uint32_t m_maxNumMergeCand; //Merge选择的候选个数,默认值为3 use param uint32_t m_endCUAddr;//一帧中最后实际像素在帧中的4x4块标号+1 Slice() { m_lastIDR = 0; m_sLFaseFlag = true; m_numRefIdx[0] = m_numRefIdx[1] = 0; for (int i = 0; i < MAX_NUM_REF; i++) { m_refPicList[0][i] = NULL; m_refPicList[1][i] = NULL; m_refPOCList[0][i] = 0; m_refPOCList[1][i] = 0; } disableWeights(); } /** 函数功能 : 关闭当前帧的加权预测 /* 调用范围 : 只在Slice()、FrameEncoder::compressFrame()、weightAnalyse函数中被调用 * 返回值 : null **/ void disableWeights(); /** 函数功能 : 获取参考帧List 以及 POC /* 调用范围 : 只在DPB::prepareEncode函数中被调用 * \参数 picList : DPB m_picList * 返回值 : null **/ void setRefPicList(PicList& picList); const Frame* getRefPic(int list, int refIdx) const { return refIdx >= 0 ? m_refPicList[list][refIdx] : NULL; } bool getRapPicFlag() const { return m_nalUnitType == NAL_UNIT_CODED_SLICE_IDR_W_RADL || m_nalUnitType == NAL_UNIT_CODED_SLICE_CRA; } bool getIdrPicFlag() const { return m_nalUnitType == NAL_UNIT_CODED_SLICE_IDR_W_RADL; } bool isIRAP() const { return m_nalUnitType >= 16 && m_nalUnitType <= 23; }//判断是否关键帧:IRAP(Intra Random Access Point)三种IRAP IDR(Instantaneous Decoding Refresh) CRA(Clean Random Access) BLA(Broken Link Access) bool isIntra() const { return m_sliceType == I_SLICE; } bool isInterB() const { return m_sliceType == B_SLICE; } bool isInterP() const { return m_sliceType == P_SLICE; } /** 函数功能 : 返回一帧中最后实际像素在帧中的4x4块标号+1 /* 调用范围 : 只在Encoder::encode函数中被调用 * \参数 endCUAddr : (一帧CTU个数)*(在CTU中4x4的个数) * 返回值 : 返回一帧中最后实际像素在帧中的4x4块标号+1 **/ uint32_t realEndAddress(uint32_t endCUAddr) const; }; } #endif // ifndef X265_SLICE_H
相关文章推荐
- Warning: Attempt to present on whose view is not in the window hierarchy!
- Java-集合框架Collection之List(二)
- java后台框架 springmvc整合mybatis框架源码 bootstrap html5 mysql oracle
- php中创建关联数组,以及遍历数组
- Android开发 解决"ADB Not Responding"ADB占用冲突
- Sping下添加启动时运行的方法
- STL模板库在ACM中的应用(I)
- Ancient Cipher
- x265-1.8版本-common/slice.cpp注释
- 编程中的offsetof
- 1034. Head of a Gang (30)
- javaEE 后台框架 SpringMVC Mybatis Shiro druid Bootstrap HTML5 hibernate
- x265-1.8版本-common/scalinglist.h注释
- C++Primer学习之三auto和decltype
- Git学习序列3---远程仓库
- Hello World!
- 【诠释版】12 steps to Navier-Stokes —— Introduction and Step 1【待修改】
- 【bzoj 1911】【Apio2010】特别行动队 dp+单调队列斜率优化
- 宁波金鸟服饰有限公司感恩年会
- linux部署及linux命令