您的位置:首页 > 理论基础 > 数据结构算法

数据结构实验之二叉树六:哈夫曼编码

2017-11-06 12:04 155 查看


Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。


Input

 输入数据有多组,每组数据一行,表示要编码的字符串。


Output

 对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。


Example Input

AAAAABCD
THE_CAT_IN_THE_HAT



Example Output

64 13 4.9
144 51 2.8



code:

#include <iostream>

#include <cstdio>

#include <cstring>

using namespace std;

void qsort(int a[], int l, int r)

{

    int x = a[l];

    int i = l, j = r;

    if(l>=r) return;

    while(i<j)

    {

        if(i<j&&a[j]>=x) j--;

        a[i] = a[j];

        if(i<j&&a[i]<=x) i++;

        a[j] = a[i];

    }

    a[i] = x;

    qsort(a, l, i-1);

    qsort(a, i+1, r);

}

int main()

{

    char s[1000];

    int t[500];

    int q[1000];

    while(~scanf("%s", s))

    {

        int sum1, sum2 = 0;

        int top = 0, rear = 0;

        memset(t, 0, sizeof(t));

        int len = strlen(s);

        sum1 = 8*len;

        for(int i = 0;i<len;i++)

        {

            t[s[i]]++;

        }

        for(int i = 0;i<500;i++)

        {

            if(t[i]!=0) q[top++] = t[i];

        }

        qsort(q, 0, top-1);

        while(top!=rear)

        {

            int x1 = q[rear++];

            if(top!=rear)

            {

                int x2 = q[rear++];

                sum2 += (x1+x2);

                q[top++] = x1+x2;

                qsort(q, rear, top-1);

            }

        }

        printf("%d %d %.1lf\n", sum1, sum2, 1.0*sum1/sum2);

    }

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: