您的位置:首页 > 理论基础 > 数据结构算法

数据结构实验之二叉树六:哈夫曼编码

2016-11-05 15:24 357 查看


#include <bits/stdc++.h>  //包含所有的c++函数;
using namespace std;

int pp[140];  //记录所有的字母出现的次数;
char str[140];

int main()
{
while(~scanf("%s",str))
{
getchar(); //显示键盘输出的值;
memset(pp, 0, sizeof(pp)); //数组清零;
int sum = strlen(str)*8; //开双倍数组大小的值;
priority_queue<int, vector<int>, greater<int> >Q;//优先队列,内部含有自动排列,greater<int>从小到大排列整形数据; less<int>从大到小排列整形数据;
for(int i = 0; str[i] != '\0'; i++)
{
pp[str[i]]++;   //记录每个字符在字符串中出现的次数;
}
for(int i = 0; i < 140; i++)
{
if(pp[i])  //如果字符在字符串中出现的次数不是0;
Q.push(pp[i]); //将出现次数不是零的字符压入到队列中;
}
int num = 0;
while(!Q.empty()) //此时队列不是空的;
{
int ans = Q.top(); //返回队列的头字符;
Q.pop(); //队列的头字符出队列;
if(!Q.empty())//原先的头字符出队列后,此时的队列不为空;
{
int tmp = Q.top(); //返回此时的队列头字符;
Q.pop(); //此时的头字符出队列;
ans += tmp;  //----||
num += ans;//------||得出队列中两个最小的字符ascll码的和;
Q.push(ans);//将最小之和压入到队列中,使之成为队列头(队头).
}
}
printf("%d %d %.1f\n", sum, num, (1.0*sum)/num);
}
return 0;
}


Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。


Input

 输入数据有多组,每组数据一行,表示要编码的字符串。


Output

 对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。


Example Input

AAAAABCD
THE_CAT_IN_THE_HAT



Example Output

64 13 4.9
144 51 2.8


#include <bits/stdc++.h>
using namespace std;

int pp[140];
char str[140];

int main()
{
while(~scanf("%s",str))//输入字符串;
{
getchar(); //显示键盘输入;
memset(pp, 0, sizeof(pp));//数组清零;
int sum = strlen(str)*8;//开两倍长度;
priority_queue<int, vector<int>, greater<int> >Q;  //最优队列,内部含有排序,greater是从小到大排序,less 从大到小排序;
for(int i = 0; str[i] != '\0'; i++)
{
pp[str[i]]++;   //字母出现的次数;
}
for(int i = 0; i < 140; i++)
{
if(pp[i])
Q.push(pp[i]);  //将出现次数不为0的字母压入队列中;
}
int num = 0;
while(!Q.empty()) //数组不为空;
{
int ans = Q.top(); //返回队头;
Q.pop(); // 队头出列;
if(!Q.empty()) //队头出列后 数组不为空
{
int tmp = Q.top(); //返回此时的队头;
Q.pop(); //此时队头出列;
ans += tmp;  //ans 和 num 是队列中最小的;
num += ans;
Q.push(ans); //这两个最小的值的和,压入队列;
}  //通过while 反复循环;
}
printf("%d %d %.1f\n", sum, num, (1.0*sum)/num);
}
return 0;
}

#include <bits/stdc++.h>
using namespace std;

int pp[140];
char str[140];

int main()
{
while(~scanf("%s",str))
{
getchar();
memset(pp, 0, sizeof(pp));
int sum = strlen(str)*8;
priority_queue<int, vector<int>, greater<int> >Q;  //优先级队列,里面的数据类型是int,vector<int>开放一个容器,里面存放int型的数据,greater<int>从小到大排列int型的数据;
for(int i = 0; str[i] != '\0'; i++)
{
pp[str[i]]++; //记录字符出现的次数和概率;
}
for(int i = 0; i < 140; i++)
{
if(pp[i])
Q.push(pp[i]); //把这些出现次数不是零的字符全部存放入队列中;
}
int num = 0;
while(!Q.empty()) //如果队列不是空的;//一直循环就是哈夫曼编码。
{
int ans = Q.top(); //取出队列头部的元素;
Q.pop(); //删除取出的头部的元素;
if(!Q.empty()) //删除一个元素后,不为空;
{
int tmp = Q.top(); //继续取出此时的队列头部的元素;
Q.pop();//删除此时的队列头部元素;
ans += tmp; //  ->|
num += ans;//   ->|----》这两个元素相互结合形成一个新的元素ans;
Q.push(ans);//将新生成的ans新元素,放入到队列中.
}
}
printf("%d %d %.1f\n", sum, num, (1.0*sum)/num);
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: