7.7 赫夫曼树应用解析(叶子到根逆向求每个字符的赫夫曼编码)
2013-08-26 21:27
225 查看
赫夫曼树(Huffman):又称最优树,是一类带权路径长度最短的树。带权路径长度最小的二叉树称作
最优二叉树或赫夫曼树。
带权路径的计算:记做WPL是路径长度和节点上权的乘积。
构造赫夫曼树(四步骤):
1、n个权值{w1, w2,w3,…..wn}构造n棵二叉树的集合F{T1, T2, T3,…..Tn},其中每棵二叉树Ti中只有一个带权的根节点Wi,其左右子树均未空。
2、在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根节点的权值为其左、右子树上根结点的权值之和。
3、在F中删除这两棵树,同时将得到的二叉树加入F中。
4、重复(2)、(3),直到F中只含一棵树为止,这便是赫夫曼树。
注意点:
赫夫曼树中没有度为1的结点,一棵有n个子结点的赫夫曼树公有2n-1个结点。可以存储在一个大小为2n-1的一维数组中。
在构成赫夫曼树之后,力求编码从叶子结点出发走一条叶子到根的路径;
而译码从根出发走一条从根到叶子的路径。则对每个结点来说,既需知道双亲的信息,又需知道孩子的信息。
下面程序:
输出结果:
最优二叉树或赫夫曼树。
带权路径的计算:记做WPL是路径长度和节点上权的乘积。
构造赫夫曼树(四步骤):
1、n个权值{w1, w2,w3,…..wn}构造n棵二叉树的集合F{T1, T2, T3,…..Tn},其中每棵二叉树Ti中只有一个带权的根节点Wi,其左右子树均未空。
2、在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根节点的权值为其左、右子树上根结点的权值之和。
3、在F中删除这两棵树,同时将得到的二叉树加入F中。
4、重复(2)、(3),直到F中只含一棵树为止,这便是赫夫曼树。
注意点:
赫夫曼树中没有度为1的结点,一棵有n个子结点的赫夫曼树公有2n-1个结点。可以存储在一个大小为2n-1的一维数组中。
在构成赫夫曼树之后,力求编码从叶子结点出发走一条叶子到根的路径;
而译码从根出发走一条从根到叶子的路径。则对每个结点来说,既需知道双亲的信息,又需知道孩子的信息。
下面程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 | /***********************************************************/ // 程序名称:HuffmanTree.cpp // 程序目的:设计一个叶子到根逆向求每个字符的赫夫曼编码的程序 // 程序来源:数据结构与算法分析(C语言描述) P-147 // 日期:2013-8-26 21:22:19 /***********************************************************/ #include <stdio.h> #include <stdlib.h> #include <limits.h> #include <string.h> #define Error( str ) FatalError( str ) #define FatalError( str ) fprintf( stderr, "%s\n", str ), exit( 1 ) typedef int ElementType; #define MAXQUEUE 10 typedef struct huffmantree { unsigned int weight; // 权值 unsigned int parent, lchild, rchild; } HTNode, *HuffmanTree; // 动态分配数组存储赫夫曼树 typedef char* *HuffmanCode; // 动态分配数组存储赫夫曼编码表 int Min(HuffmanTree t, int i); void Select(HuffmanTree t, int i, int &s1, int &s2); void HuffmanTreeCoding(HuffmanTree &HT, HuffmanCode &HC, int *w, int n); /************************************************************************/ // 主程序 /************************************************************************/ int main(void) { HuffmanTree HT; HuffmanCode HC; int n; printf("请输入权值的个数(大于1): "); scanf("%d", &n); int* w; w = (int*)malloc(n * sizeof(int)); printf("请输入%d个权值的(整型): \n", n); for (int i=0; i <= n-1; i++) scanf("%d", w+i); HuffmanTreeCoding(HT, HC, w, n); for (int i=1; i <=n; i++) puts(HC[i]); return 0; } /************************************************************************/ // 获得totalNode个结点中权值最小的结点的序号 /************************************************************************/ int Min(HuffmanTree t, int totalNodes) { // 返回totalNodes个结点中权值最小的根结点序号 int minIndex = 0; unsigned int unWeight = UINT_MAX; // 无符号整型最大值 for (int i=1; i <= totalNodes; i++) { if (t[i].weight < unWeight && t[i].parent == 0) // t[i]为根结点 { unWeight = t[i].weight; minIndex = i; } } t[minIndex].parent = 1; // 给选中的根节点双亲赋1,避免第2次查找改点 return minIndex; } /************************************************************************/ // 选择权值最小的树的根结点的序号 /************************************************************************/ void Select(HuffmanTree t, int minIndex, int &minIndex1, int &minIndex2) { minIndex1 = Min(t, minIndex); minIndex2 = Min(t, minIndex); int tempIndex; if (minIndex1 > minIndex2) { tempIndex = minIndex1; minIndex1 = minIndex2; minIndex2 = tempIndex; } return; } /************************************************************************/ // 求解赫夫曼编码 /************************************************************************/ void HuffmanTreeCoding(HuffmanTree &HT, HuffmanCode &HC, int* w, int n) { // w存放n个字符的权值(均>0), 构造赫夫曼树,求出n个字符的赫夫曼编码HC if (n <= 1) return; int nNodes; // 总结点和 int nodeIndex; // 根结点序号 nNodes = 2 * n - 1; HT = (HuffmanTree)malloc( sizeof(HTNode) * (nNodes+1) ); // 0号单元未用 HuffmanTree pTree; pTree = HT+1; for (nodeIndex=1; nodeIndex <= n; ++nodeIndex,++pTree, ++w) { pTree->weight = *w; pTree->parent = 0; pTree->lchild = 0; pTree->rchild = 0; } for ( ; nodeIndex <= nNodes; ++nodeIndex, ++pTree) (*pTree).parent = 0; // 创建赫夫曼树 int minIndex1, minIndex2; for (nodeIndex = n+1; nodeIndex <= nNodes; nodeIndex++) // 循环n-1次 { // 在HT[1~nodeIndexs-1]中选择parent为0且weight最小的两个结点,其序号分别为minIndex1,minIndex2 Select(HT, nodeIndex-1, minIndex1, minIndex2); HT[minIndex1].parent = HT[minIndex2].parent = nodeIndex; HT[nodeIndex].lchild = minIndex1; HT[nodeIndex].rchild = minIndex2; HT[nodeIndex].weight = HT[minIndex1].weight + HT[minIndex2].weight; } // 从叶子到根逆向求每个字符的赫夫曼编码 HC = (HuffmanCode)malloc( (n+1)*sizeof(char*)); // 分配n个字符编码的头指针向量([0]不用) char* codingSize; codingSize = (char*)malloc(sizeof(char) * n); // 分配求编码的工作空间 codingSize[n-1] = '\0'; // 编码结束符 for (nodeIndex = 1; nodeIndex <= n; nodeIndex++) { // 逐个字符求赫夫曼编码 int pos; unsigned int c, f; pos = n - 1; // 编码结束位置 for (c=nodeIndex, f=HT[nodeIndex].parent; f != 0; c=f, f = HT[f].parent) { // 从叶子到根逆向求编码 if (HT[f].lchild == c) codingSize[--pos] = '0'; else codingSize[--pos] = '1'; HC[nodeIndex] = (char*)malloc((n - pos) * sizeof(char)); // 为第i个字符编码分配空间 strcpy(HC[nodeIndex], &codingSize[pos]); // 从codingSize复制编码串到HC } } free(codingSize); // 释放工作区间 return; } |
相关文章推荐
- 7.8 赫夫曼树应用解析(跟结点到叶子求每个字符的赫夫曼编码)
- 数据结构--二叉树--输出树中从根到每个叶子节点的路径(树遍历算法的应用) .
- 数据结构_赫夫曼树、赫夫曼编码及其应用(数据的压缩和解压)
- 读卡器应用函数整理 3.将每个十六进制存储的字节转换成ascii字符存储
- 统计每个字符出现的次数-字典集合应用
- 求根结点到每个叶子节点的逆序列【后序遍历非递归的应用】
- 把字符串中每个字符都相同的子串解析出来--用正则表达式实现
- Android逆向之旅---应用的"反调试"方案解析(附加修改IDA调试端口和修改内核信息)
- 解析UTF8字符串,并截取每个字符到vector(C++代码)
- 字符流解析与简单应用
- Android逆向之旅---应用的"反调试"方案解析(附加修改IDA调试端口和修改内核信息)
- 开发window应用商店程序时提示字符无法解析
- 正则表达式 特殊字符应用分析[简单详细入门必看]
- 字符指针数组和字符数组应用
- Android逆向之旅---解析编译之后的Resource.arsc文件格式
- Android逆向之旅---解析编译之后的Dex文件格式
- java中特殊字符\b在windows控制台的动画应用
- 字典序问题。在数据加密和数据压缩中常需要对特殊的字符串进行编码。给定的字母表A由26个小写字母组成。该字母表产生的升序字符串中字母从左到右出现的次序与字母在字母表中出现的次序相同,且每个字符最多出现1
- Python统计web应用的每个连接使用情况
- Java基础——数组应用之字符串String类