您的位置：首页 > 其它

动态规划之最优二叉搜索树

2015-04-20 15:41 183 查看

我们在之前也讨论过动态规划的例子：

动态规划原理：/article/1367727.html

钢条切割问题：/article/1367729.html

矩阵链乘法问题：/article/1367729.html

最长公共子序列：/article/1367726.html

这次我们来讨论另外一个动态规划的例子，最优二叉搜索树。

在进入主题之前，我们先提一下动态规划的两大特征：

具有最优子结构

子问题重叠

问题背景

假设现在我们要做一个软件，需要将英文按照单词翻译成中文，每一个英文单词都有一个对应的中文解释。现在我们需要将这些英文单词单词进行排序，然后将这些英文单词无差别的加入到二叉搜索树里面！每一个单词都要进行搜索，我们要求所需的时间尽可能的少，我们可以通过红黑树或者其他平衡搜索结构使得每次搜索时间为log(n)log(n)。

但是这里有个问题，每一个单词出现的频率都不一样。比如the出现的概率就比其他单词出现的概率大得多，要是我们将the放在搜索树的叶子上，那么每次都要从搜索树的根一直搜查到叶子，那将是很费时间的。那么我们要尽量将概率大的单词放在靠近根部的位置，概率小的单词放在靠近叶子的位置。

问题描述

给定一个n个不同关键字已排序的序列K=<k1,k2,k3,...kn>(k1<k2<k3<...<kn)K=(k1.我们希望用这些不同的关键字构建一棵二叉搜索树。其中每一个kiki都有一个对应的搜索概率pipi,有些要搜索的值不在KK中，于是我们还有n+1n+1个伪关键字，D=<d0,d1,d2,...,dn>D=,其中didi表示比ki−1ki-1大且比kiki小的伪关键字，对应的每一个伪关键字didi，也有一个相应的搜索概率qiqi,这里的didi也可以理解为在找不到关键字的情况。

于是我们得出：

∑1npi+∑0nqi=1
\sum_1^npi + \sum_0^nqi= 1

假设我们有这样的关键字和伪关键字序列：

ipiqi00.0510.150.1020.100.0530.050.0540.100.0550.200.10
\begin{array}{c|lcr}
i & \text{0} & \text{1} & \text{2} & \text{3} & \text{4} & \text{5}\\
\hline
pi & &0.15 & 0.10 & 0.05 & 0.10 & 0.20 \\
qi & 0.05 & 0.10 & 0.05 & 0.05 & 0.05 & 0.10 \\
\end{array}

构建出下面两棵搜索树：

我们求一棵二叉搜索树的权重为：

E[T中的搜价]=∑1n(depth(ki)+1)pi+∑0n(depth(di)+1)qiE[T中的搜价]=\sum_1^n(depth(ki)+1)pi+\sum_0^n(depth(di)+1)qi

化简得：化简得：

E[T中的搜索价]=1+∑1ndepth(ki)pi+∑0ndepth(di)qiE[T中的搜索价]=1+\sum_1^ndepth(ki)pi+\sum_0^ndepth(di)qi

用上面的公式，我们计算得

aa树的搜索代价为：E[Ta]=2.80E[Ta]=2.80

bb树的搜索代价为 : E[Tb]=2.75E[Tb]=2.75

对于一个给定的概率集合，我们希望构造出一棵搜索代价最小的二叉搜索树，那么构造出来的二叉搜索树就是最优二叉搜索树！

问题分析

我们先来尝试一下蛮力法：对于一个序列，每一个关键字都有成为根节点的可能性，于是在排除伪关键字的情况下问题的规模为2∗2∗2∗...∗2=2n2*2*2*...*2=2^n,要是再加上伪关键字，那么问题的规模就更大了，所以这里问题的规模使我们最不想要的指数级的，那么来世老规矩，动态规划出场！没有动态规划还真不行啊

最优二叉搜索树的结构

我们在《动态规划原理》里面提到过，需找一个问题的最优子结构的步骤：

选择:我们在构建最优二叉搜索树的过程中，我们首先选出一个节点krkr.

假设：假设节点krkr是最优二叉搜索树根节点.

子问题：这里我们就产生了两个子问题：K1<k1,...,kr−1>K1和K2<kr+1,...,n>K2

剪切粘贴：这里的子问题K1K1和K2K2也是最优二叉搜索树，假设K1K1不是最优二叉搜索树，那么我们将K1K1当前的搜索树剪掉，将K1K1的最优二叉搜索树粘贴进去，得到一棵更优的二叉搜索树，这与原问题矛盾，不成立！所以这里最优二叉搜索树具有最优子结构！

一个递归算法

我们首先假设问题的域为kikiki到kjkjkj,其中i>=1, j <=n且j>=n-1i>=1,j<=n且j>=n−1i>=1, j <=n且j>=n-1,e[i...j]e[i...j]表示i到ji到j的最小搜索代价！

于是我们有：

当 i=j−1 i = j-1时，这时没有任何的关键字在二叉搜索树中，只包含了为关键字di−1di-1，即e[i,i−1]=qi−1e[i,i-1]=qi-1

当i>j−1 i > j-1时，我们需要在ii到j−1j-1之前选择一个节点rr，使得搜索代价最小.即:

e[i,j]=pr+(e[i,r−1]+weight(i,r−1))+(e[r+1,j]+weight(r+1,j)).e[i, j] = pr+(e[i , r-1]+weight(i , r-1))+(e[r+1, j]+weight(r+1,j)).

因为:

pr+weight(i,r−1)+weight(r+1,j)=weight(i,j)
pr+weight(i, r-1)+weight(r+1 , j) = weight(i,j)

所以上式可以简化为:

e[i,j]=e[i,r−1]+e[r+1,j]+weight(i,j)
e[i,j]=e[i,r-1]+e[r+1,j]+weight(i,j)

上面的第二种情况假定最优点是在r上面，如果选择代价最低者作为根节点，最终得到下面的递归式：

e[i,j]=⎧⎩⎨⎪⎪di−1,min { e[i,i−1]+e[i+1,j]+weight(i,j),e[i,i]+e[i+2,j]+weight(i,j),...,e[i,j]+e[j+1][j]+weight(i,j) } ,i=j−1i<=j
e[i,j]=
\begin{cases}
di-1 , & i = j-1 \\
min\ \lbrace \ e[i, i-1]+e[i+1,j]+weight(i,j),e[i, i]+e[i+2,j]+weight(i,j),...,e[i,j]+e[j+1][j]+weight(i,j)\ \rbrace \ , & i <= j
\end{cases}

计算最优二叉树的期望搜索代价

下面采用自上而下和自下而上的代码实现：

/*************************************************
* @Filename:    searchBinaryTree_v1.cc
* @Author:      qeesung
* @Email:       qeesung@qq.com
* @DateTime:    2015-04-19 09:48:21
* @Version:     1.0
* @Description: 最优二叉搜索树的算法实现，这里首先采用自上而下的求解方法
**************************************************/

#include <iostream>
#include <vector>
#include <utility>

using namespace std;

#define MAX_KEY_COUNT 10// 关键字的数量
double dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap);
/**
 * 保存i到j的最优解开
 * 为了就算e[i][i-1] e[j+1][j]这种情况，所以将行设了比列多大一维
 */
double minWeightArray[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 为了保存weight i到j的权重之和，不用每次都计算
 * 为了计算weigh[i][i-1]情况，行比列多了一维
 */
double weight[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 为了递归计算出weight[i][j]的值
 * @param  i       左边界，需要从1开始
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的权重
 */
double computeWeight(int i , int j , \
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(i-1 == j)
        weight[i][j] = fKeyMap[j].second;
    else
        weight[i][j]=computeWeight(i , j-1 , keyMap , fKeyMap)+keyMap[j].second+fKeyMap[j].second;
    return weight[i][j];
}

/**
 * 最优二叉搜索树的接口
 * @param keyMap  关键字序列
 * @param fKeyMap 伪关键字序列
 * @return 返回最优二叉搜索树的权重
 */
double bestBSTree(std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(keyMap.size()-1 > MAX_KEY_COUNT)
    {
        cerr<<"key count should less than "<<MAX_KEY_COUNT<<endl;
        return 0.0; 
    }
    /** 多次初始化i到j的权重 */
    for (int k = 1 ; k <= keyMap.size()-1+1 ; ++k)
    {
        computeWeight(k , keyMap.size()-1 , keyMap , fKeyMap);
    }
    cout<<"weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<weight[i][j]<<"\t";
        }
        cout<<endl;
    }
    // 现在已经将权重数据全都保存到weight里面了
    // 
    // 开始计算最优
    dealBestBSTree(1,keyMap.size()-1,keyMap , fKeyMap);
    cout<<"min weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<minWeightArray[i][j]<<"\t";
        }
        cout<<endl;
    }
    return minWeightArray[1][keyMap.size()-1];
}

/**
 * 最优二叉搜索树的实际递归函数
 * @param  i       左边界
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的最优值
 */
double dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(i-1 == j)
    {
        minWeightArray[i][j] = weight[i][j];    
        return weight[i][j];
    }
    if(minWeightArray[i][j]!=0)
        return minWeightArray[i][j];
    // 表示没有被计算过，现在开始计算
    double min= 10.0;
    for(int k = i ; k <= j ; ++k)
    {
        double temp = dealBestBSTree(i , k-1 , keyMap , fKeyMap)+\
                      dealBestBSTree(k+1,j , keyMap  , fKeyMap)+weight[i][j];
        if(temp < min)
            min = temp;
    }
    minWeightArray[i][j] = min;
    return min;
}

int main(int argc, char const *argv[])
{
    std::vector<pair<string , double> > keyMap;
    std::vector<pair<string , double> > fKeyMap;
    // keyMap[0]是用不到的，只是为了填充，因为关键字是从1开始的
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k2", 0.1));
    keyMap.push_back(pair<string , double>("k3", 0.05));
    keyMap.push_back(pair<string , double>("k4", 0.1));
    keyMap.push_back(pair<string , double>("k5", 0.2));

    fKeyMap.push_back(pair<string , double>("d0", 0.05));
    fKeyMap.push_back(pair<string , double>("d1", 0.1));
    fKeyMap.push_back(pair<string , double>("d2", 0.05));
    fKeyMap.push_back(pair<string , double>("d3", 0.05));
    fKeyMap.push_back(pair<string , double>("d4", 0.05));
    fKeyMap.push_back(pair<string , double>("d5", 0.1));

    cout<<"The binary search tree min weight is:"<<bestBSTree(keyMap , fKeyMap)<<endl;
    while(1);

    return 0;
}

/*************************************************
* @Filename:    searchBinaryTree_v1.cc
* @Author:      qeesung
* @Email:       qeesung@qq.com
* @DateTime:    2015-04-19 09:48:21
* @Version:     1.0
* @Description: 最优二叉搜索树的算法实现，这里首先采用自下而上的方法求解
**************************************************/

#include <iostream>
#include <vector>
#include <utility>

using namespace std;

#define MAX_KEY_COUNT 10// 关键字的数量
void dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap);
/**
 * 保存i到j的最优解开
 * 为了就算e[i][i-1] e[j+1][j]这种情况，所以将行设了比列多大一维
 */
double minWeightArray[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 为了保存weight i到j的权重之和，不用每次都计算
 * 为了计算weigh[i][i-1]情况，行比列多了一维
 */
double weight[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 为了递归计算出weight[i][j]的值
 * @param  i       左边界，需要从1开始
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的权重
 */
double computeWeight(int i , int j , \
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(i-1 == j)
        weight[i][j] = fKeyMap[j].second;
    else
        weight[i][j]=computeWeight(i , j-1 , keyMap , fKeyMap)+keyMap[j].second+fKeyMap[j].second;
    return weight[i][j];
}

/**
 * 最优二叉搜索树的接口
 * @param keyMap  关键字序列
 * @param fKeyMap 伪关键字序列
 * @return 返回最优二叉搜索树的权重
 */
double bestBSTree(std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(keyMap.size()-1 > MAX_KEY_COUNT)
    {
        cerr<<"key count should less than "<<MAX_KEY_COUNT<<endl;
        return 0.0; 
    }
    /** 多次初始化i到j的权重 */
    for (int k = 1 ; k <= keyMap.size()-1+1 ; ++k)
    {
        computeWeight(k , keyMap.size()-1 , keyMap , fKeyMap);
    }
    cout<<"weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<weight[i][j]<<"\t";
        }
        cout<<endl;
    }
    // 现在已经将权重数据全都保存到weight里面了
    // 
    // 开始计算最优
    dealBestBSTree(1,keyMap.size()-1,keyMap , fKeyMap);
    cout<<"min weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<minWeightArray[i][j]<<"\t";
        }
        cout<<endl;
    }
    return minWeightArray[1][keyMap.size()-1];
}

/**
 * 最优二叉搜索树的实际递归函数
 * @param  i       左边界
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的最优值
 */
void dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    // 初始化minWeightArray数组，将 i-1 == j的情况全都赋值
    for(int k = i ; k <= j+1 ; ++k)
    {
        minWeightArray[k][k-1] = weight[k][k-1];
    }
    // 下面自下而上的来求解
    for(int k = 0 ; k < j-i+1 ; ++k)
    {
        for(int m = i ; m <= j ; ++m)
        {
            double min = 10.0;
            for(int w = m ; w <= m+k ; ++w )
            {
                double temp = minWeightArray[m][w-1]+minWeightArray[w+1][m+k]+weight[m][m+k];
                if(temp < min)
                    min = temp;
            }
            minWeightArray[m][m+k] = min;
        }
    }
}

int main(int argc, char const *argv[])
{
    std::vector<pair<string , double> > keyMap;
    std::vector<pair<string , double> > fKeyMap;
    // keyMap[0]是用不到的，只是为了填充，因为关键字是从1开始的
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k2", 0.1));
    keyMap.push_back(pair<string , double>("k3", 0.05));
    keyMap.push_back(pair<string , double>("k4", 0.1));
    keyMap.push_back(pair<string , double>("k5", 0.2));

    fKeyMap.push_back(pair<string , double>("d0", 0.05));
    fKeyMap.push_back(pair<string , double>("d1", 0.1));
    fKeyMap.push_back(pair<string , double>("d2", 0.05));
    fKeyMap.push_back(pair<string , double>("d3", 0.05));
    fKeyMap.push_back(pair<string , double>("d4", 0.05));
    fKeyMap.push_back(pair<string , double>("d5", 0.1));

    cout<<"The binary search tree min weight is:"<<bestBSTree(keyMap , fKeyMap)<<endl;
    while(1);

    return 0;
}

下面两个是带有求解决方案的代码，也是自上而下和自下而上的：

/*************************************************
* @Filename:    searchBinaryTree_v1.cc
* @Author:      qeesung
* @Email:       qeesung@qq.com
* @DateTime:    2015-04-19 09:48:21
* @Version:     1.0
* @Description: 最优二叉搜索树的算法实现，这里首先采用自上而下的求解方法,这里需要求出最优解
**************************************************/

#include <iostream>
#include <vector>
#include <utility>

using namespace std;

#define MAX_KEY_COUNT 10// 关键字的数量
double dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap);
/**
 * 保存i到j的最优解开
 * 为了就算e[i][i-1] e[j+1][j]这种情况，所以将行设了比列多大一维
 */
double minWeightArray[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 为了保存weight i到j的权重之和，不用每次都计算
 * 为了计算weigh[i][i-1]情况，行比列多了一维
 */
double weight[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 保存在i到j的切分点
 */
double rootPoint[MAX_KEY_COUNT][MAX_KEY_COUNT];

void printSolution(int i , int j , std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if( i == j)
    {
        cout<<"from "<<i<<" to "<<j<<" root is "<<keyMap[i].first<<endl;
        return;
    }
    cout<<"from "<<i<<" to "<<j<<" root is "<<keyMap[rootPoint[i][j]].first<<endl;
    printSolution(i , rootPoint[i][j]-1 , keyMap , fKeyMap);
    printSolution(rootPoint[i][j]+1 , j , keyMap , fKeyMap);
    return;
}

/**
 * 为了递归计算出weight[i][j]的值
 * @param  i       左边界，需要从1开始
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的权重
 */
double computeWeight(int i , int j , \
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(i-1 == j)
        weight[i][j] = fKeyMap[j].second;
    else
        weight[i][j]=computeWeight(i , j-1 , keyMap , fKeyMap)+keyMap[j].second+fKeyMap[j].second;
    return weight[i][j];
}

/**
 * 最优二叉搜索树的接口
 * @param keyMap  关键字序列
 * @param fKeyMap 伪关键字序列
 * @return 返回最优二叉搜索树的权重
 */
double bestBSTree(std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(keyMap.size()-1 > MAX_KEY_COUNT)
    {
        cerr<<"key count should less than "<<MAX_KEY_COUNT<<endl;
        return 0.0; 
    }
    /** 多次初始化i到j的权重 */
    for (int k = 1 ; k <= keyMap.size()-1+1 ; ++k)
    {
        computeWeight(k , keyMap.size()-1 , keyMap , fKeyMap);
    }
    cout<<"weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<weight[i][j]<<"\t";
        }
        cout<<endl;
    }
    // 现在已经将权重数据全都保存到weight里面了
    // 
    // 开始计算最优
    dealBestBSTree(1,keyMap.size()-1,keyMap , fKeyMap);
    cout<<"min weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<minWeightArray[i][j]<<"\t";
        }
        cout<<endl;
    }
    return minWeightArray[1][keyMap.size()-1];
}

/**
 * 最优二叉搜索树的实际递归函数
 * @param  i       左边界
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的最优值
 */
double dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(i-1 == j)
    {
        minWeightArray[i][j] = weight[i][j];    
        return weight[i][j];
    }
    if(minWeightArray[i][j]!=0)
        return minWeightArray[i][j];
    // 表示没有被计算过，现在开始计算
    double min = 10.0;
    int rootPos = i;
    for(int k = i ; k <= j ; ++k)
    {
        double temp = dealBestBSTree(i , k-1 , keyMap , fKeyMap)+\
                      dealBestBSTree(k+1,j , keyMap  , fKeyMap)+weight[i][j];
        if(temp < min)
        {
            min = temp;
            rootPos = k;
        }
    }
    minWeightArray[i][j] = min;
    rootPoint[i][j] = rootPos;
    return min;
}

int main(int argc, char const *argv[])
{
    std::vector<pair<string , double> > keyMap;
    std::vector<pair<string , double> > fKeyMap;
    // keyMap[0]是用不到的，只是为了填充，因为关键字是从1开始的
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k2", 0.1));
    keyMap.push_back(pair<string , double>("k3", 0.05));
    keyMap.push_back(pair<string , double>("k4", 0.1));
    keyMap.push_back(pair<string , double>("k5", 0.2));

    fKeyMap.push_back(pair<string , double>("d0", 0.05));
    fKeyMap.push_back(pair<string , double>("d1", 0.1));
    fKeyMap.push_back(pair<string , double>("d2", 0.05));
    fKeyMap.push_back(pair<string , double>("d3", 0.05));
    fKeyMap.push_back(pair<string , double>("d4", 0.05));
    fKeyMap.push_back(pair<string , double>("d5", 0.1));

    cout<<"The binary search tree min weight is:"<<bestBSTree(keyMap , fKeyMap)<<endl;
    printSolution(1,keyMap.size()-1,keyMap , fKeyMap);
    while(1);

    return 0;
}

/*************************************************
* @Filename:    searchBinaryTree_v1.cc
* @Author:      qeesung
* @Email:       qeesung@qq.com
* @DateTime:    2015-04-19 09:48:21
* @Version:     1.0
* @Description: 最优二叉搜索树的算法实现，这里首先采用自下而上的方法求解,带有解决方案
**************************************************/

#include <iostream>
#include <vector>
#include <utility>

using namespace std;

#define MAX_KEY_COUNT 10// 关键字的数量
void dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap);
/**
 * 保存i到j的最优解开
 * 为了就算e[i][i-1] e[j+1][j]这种情况，所以将行设了比列多大一维
 */
double minWeightArray[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 为了保存weight i到j的权重之和，不用每次都计算
 * 为了计算weigh[i][i-1]情况，行比列多了一维
 */
double weight[MAX_KEY_COUNT+2][MAX_KEY_COUNT+1];

/**
 * 保存在i到j的切分点
 */
double rootPoint[MAX_KEY_COUNT][MAX_KEY_COUNT];

void printSolution(int i , int j , std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if( i == j)
    {
        cout<<"from "<<i<<" to "<<j<<" root is "<<keyMap[i].first<<endl;
        return;
    }
    cout<<"from "<<i<<" to "<<j<<" root is "<<keyMap[rootPoint[i][j]].first<<endl;
    printSolution(i , rootPoint[i][j]-1 , keyMap , fKeyMap);
    printSolution(rootPoint[i][j]+1 , j , keyMap , fKeyMap);
    return;
}

/**
 * 为了递归计算出weight[i][j]的值
 * @param  i       左边界，需要从1开始
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的权重
 */
double computeWeight(int i , int j , \
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(i-1 == j)
        weight[i][j] = fKeyMap[j].second;
    else
        weight[i][j]=computeWeight(i , j-1 , keyMap , fKeyMap)+keyMap[j].second+fKeyMap[j].second;
    return weight[i][j];
}

/**
 * 最优二叉搜索树的接口
 * @param keyMap  关键字序列
 * @param fKeyMap 伪关键字序列
 * @return 返回最优二叉搜索树的权重
 */
double bestBSTree(std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    if(keyMap.size()-1 > MAX_KEY_COUNT)
    {
        cerr<<"key count should less than "<<MAX_KEY_COUNT<<endl;
        return 0.0; 
    }
    /** 多次初始化i到j的权重 */
    for (int k = 1 ; k <= keyMap.size()-1+1 ; ++k)
    {
        computeWeight(k , keyMap.size()-1 , keyMap , fKeyMap);
    }
    cout<<"weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<weight[i][j]<<"\t";
        }
        cout<<endl;
    }
    // 现在已经将权重数据全都保存到weight里面了
    // 
    // 开始计算最优
    dealBestBSTree(1,keyMap.size()-1,keyMap , fKeyMap);
    cout<<"min weight array"<<endl;
    for (int i =1 ; i<= keyMap.size() ; ++i)
    {
        for (int j = 0 ; j<keyMap.size() ; ++j)
        {
            cout<<minWeightArray[i][j]<<"\t";
        }
        cout<<endl;
    }
    return minWeightArray[1][keyMap.size()-1];
}

/**
 * 最优二叉搜索树的实际递归函数
 * @param  i       左边界
 * @param  j       右边界
 * @param  keyMap  关键字序列
 * @param  fKeyMap 伪关键字序列
 * @return         i到j的最优值
 */
void dealBestBSTree(int i , int j ,\
    std::vector<pair<string , double> > keyMap,\
    std::vector<pair<string , double> > fKeyMap)
{
    // 初始化minWeightArray数组，将 i-1 == j的情况全都赋值
    for(int k = i ; k <= j+1 ; ++k)
    {
        minWeightArray[k][k-1] = weight[k][k-1];
    }
    // 下面自下而上的来求解
    for(int k = 0 ; k < j-i+1 ; ++k)
    {
        for(int m = i ; m <= j ; ++m)
        {
            double min = 10.0;
            int rootPos = i;
            for(int w = m ; w <= m+k ; ++w )
            {
                double temp = minWeightArray[m][w-1]+minWeightArray[w+1][m+k]+weight[m][m+k];
                if(temp < min)
                {
                    min = temp;
                    rootPos = w;
                }
            }
            rootPoint[m][m+k] = rootPos;
            minWeightArray[m][m+k] = min;
        }
    }
}

int main(int argc, char const *argv[])
{
    std::vector<pair<string , double> > keyMap;
    std::vector<pair<string , double> > fKeyMap;
    // keyMap[0]是用不到的，只是为了填充，因为关键字是从1开始的
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k1", 0.15));
    keyMap.push_back(pair<string , double>("k2", 0.1));
    keyMap.push_back(pair<string , double>("k3", 0.05));
    keyMap.push_back(pair<string , double>("k4", 0.1));
    keyMap.push_back(pair<string , double>("k5", 0.2));

    fKeyMap.push_back(pair<string , double>("d0", 0.05));
    fKeyMap.push_back(pair<string , double>("d1", 0.1));
    fKeyMap.push_back(pair<string , double>("d2", 0.05));
    fKeyMap.push_back(pair<string , double>("d3", 0.05));
    fKeyMap.push_back(pair<string , double>("d4", 0.05));
    fKeyMap.push_back(pair<string , double>("d5", 0.1));

    cout<<"The binary search tree min weight is:"<<bestBSTree(keyMap , fKeyMap)<<endl;
    printSolution(1,keyMap.size()-1,keyMap , fKeyMap);
    while(1);

    return 0;
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航