数据结构实验之二叉树六:哈夫曼编码
2017-11-11 09:16
281 查看
数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536KBSubmit Statistic
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Example Input
AAAAABCD THE_CAT_IN_THE_HAT
Example Output
64 13 4.9 144 51 2.8
Hint
Author
先说一下哈夫曼编码:设某信源产生有五种符号u1、u2、u3、u4和u5,对应概率P1=0.4,P2=0.1,P3=P4=0.2,P5=0.1。首先,将符号按照概率由大到小排队,编码时,从最小概率的两个符号开始,可选其中一个支路为0,另一支路为1。这里,我们选上支路为0,下支路为1。再将已编码的两支路的概率合并,并重新排队。多次重复使用上述方法直至合并概率归一时为止。可能出现两者虽平均码长相等,但同一符号可以有不同的码长,即编码方法并不唯一,其原因是两支路概率合并后重新排队时,可能出现几个支路概率相等,造成排队方法不唯一。一般,若将新合并后的支路排到等概率的最上支路,将有利于缩短码长方差,且编出的码更接近于等长码。
简单来说在此题的理解中就是把给定的字符串中的ASCII码中的编号出现的频率按照从小到大的顺序排列,然后每次从其中挑出两个最小的相加,然后放入继续排序,这两个数的和暂存下来,每次都加上新产生最小的和,最后的结果就是所求的编码。详见百度文库:点击打开链接
这个题最简单的就是用STL优先队列来做,由于平时的测试不能用STL的固定模板,所以手写了一个数组+快排模拟的优先队列
#include <iostream> #include <string.h> #include <stdio.h> using namespace std; void qsort(int a[], int low, int high) //从小到大快排 { int x = a[low], i = low, j = high; if(low >= high) return; while(i < j) { if(i < j && a[j] >= x) j--; a[i] = a[j]; if(i < j && a[i] <= x) i++; a[j] = a[i]; } a[i] = x; qsort(a,low, i - 1); qsort(a,i + 1, high); } int main() { ios::sync_with_stdio(false); char s[1000]; int t[500]; //将字符串中的字符转化为ASCII码中的编号存入数组中,并且记录个数 int q[1000]; while(cin >> s) { int sum1, sum2 = 0; //初始化 int top = 0, rear = 0; memset(t, 0, sizeof(t)); //初始化t中默认值全为0 int len = strlen(s); sum1 = 8 * len; //ASCII码每个字符占8个字节 for(int i = 0; i < len; i++) //将字符按照ASCII码中的编号存入中间数组,会记录下出现的次数 t[s[i]]++; for(int i = 0; i < 500; i++) { if(t[i] != 0) q[top++] = t[i]; //将出现的次数放入队列中 } qsort(q, 0, top- 1); //对队列快排 while(top != rear) { int x1 = q[rear++]; //取出最小的两个也就是队列最开始两个,相加产生的新数据存入队列中然后快排 if(top != rear) //直到结束 { int x2 = q[rear++]; sum2 = sum2 + (x1 + x2); q[top++] = x1 + x2; qsort(q, rear, top - 1); } } printf("%d %d %.1lf\n", sum1, sum2, 1.0 * sum1 / sum2); } return 0; }
相关文章推荐
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码 sdutoj3345
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码
- 数据结构实验之二叉树六:哈夫曼编码