您的位置：首页 > 理论基础 > 数据结构算法

数据结构实验之二叉树六：哈夫曼编码

2017-11-11 09:16 281 查看

数据结构实验之二叉树六：哈夫曼编码

Time Limit: 1000MS Memory Limit: 65536KB

Submit Statistic

Problem Description

字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中，其压缩率通常在20%～90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input

输入数据有多组，每组数据一行，表示要编码的字符串。

Output

对应字符的ASCII编码长度la，huffman编码长度lh和la/lh的值(保留一位小数)，数据之间以空格间隔。

Example Input

AAAAABCD
THE_CAT_IN_THE_HAT

Example Output

64 13 4.9
144 51 2.8

Hint

Author

先说一下哈夫曼编码：

设某信源产生有五种符号u1、u2、u3、u4和u5，对应概率P1=0.4，P2=0.1，P3=P4=0.2，P5=0.1。首先，将符号按照概率由大到小排队，编码时，从最小概率的两个符号开始，可选其中一个支路为0，另一支路为1。这里，我们选上支路为0，下支路为1。再将已编码的两支路的概率合并，并重新排队。多次重复使用上述方法直至合并概率归一时为止。可能出现两者虽平均码长相等，但同一符号可以有不同的码长，即编码方法并不唯一，其原因是两支路概率合并后重新排队时，可能出现几个支路概率相等，造成排队方法不唯一。一般，若将新合并后的支路排到等概率的最上支路，将有利于缩短码长方差，且编出的码更接近于等长码。

简单来说在此题的理解中就是把给定的字符串中的ASCII码中的编号出现的频率按照从小到大的顺序排列，然后每次从其中挑出两个最小的相加，然后放入继续排序，这两个数的和暂存下来，每次都加上新产生最小的和，最后的结果就是所求的编码。详见百度文库：点击打开链接

这个题最简单的就是用STL优先队列来做，由于平时的测试不能用STL的固定模板，所以手写了一个数组+快排模拟的优先队列

#include <iostream>
#include <string.h>
#include <stdio.h>
using namespace std;

void qsort(int a[], int low, int high)  //从小到大快排
{
int x = a[low], i = low, j = high;
if(low >= high)
return;
while(i < j)
{
if(i < j && a[j] >= x)
j--;
a[i] = a[j];
if(i < j && a[i] <= x)
i++;
a[j] = a[i];
}
a[i] = x;
qsort(a,low, i - 1);
qsort(a,i + 1, high);
}

int main()
{
ios::sync_with_stdio(false);
char s[1000];
int t[500];                         //将字符串中的字符转化为ASCII码中的编号存入数组中，并且记录个数
int q[1000];
while(cin >> s)
{
int sum1, sum2 = 0;             //初始化
int top = 0, rear = 0;
memset(t, 0, sizeof(t));        //初始化t中默认值全为0
int len = strlen(s);
sum1 = 8 * len;                 //ASCII码每个字符占8个字节
for(int i = 0; i < len; i++)    //将字符按照ASCII码中的编号存入中间数组，会记录下出现的次数
t[s[i]]++;
for(int i = 0; i < 500; i++)
{
if(t[i] != 0)
q[top++] = t[i];        //将出现的次数放入队列中
}
qsort(q, 0, top- 1);            //对队列快排
while(top != rear)
{
int x1 = q[rear++];         //取出最小的两个也就是队列最开始两个，相加产生的新数据存入队列中然后快排
if(top != rear)             //直到结束
{
int x2 = q[rear++];
sum2 = sum2 + (x1 + x2);
q[top++] = x1 + x2;
qsort(q, rear, top - 1);
}
}
printf("%d %d %.1lf\n", sum1, sum2, 1.0 * sum1 / sum2);
}
return 0;
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航