您的位置:首页 > 理论基础 > 数据结构算法

数据结构笔记整理第5章:树和二叉树

2016-05-22 15:49 316 查看

第5章 树和二叉树

本章内容

本章主要介绍树、二叉树的概念,遍历方法以及应用等,本章在考研中是重点内容。

5.1 树相关的基本概念

树是一种非线性的数据结构,是若干结点的集合,有唯一的根结点和若干棵互不相交的子树构成。其中每一棵子树又是一棵树,也是由唯一的根结点和若干棵互不相交的子树组成的,由此可知:树的定义是递归的。树的结点数目可以为0,为0的时候是一棵空树。

结点:结点不仅包含数据元素,而且包含指向子树的分支。

结点的度:结点拥有子树的个数或者分支的个数。

树的度:树中各结点度的最大值。

叶子结点:终端结点,度为0的结点。

非终端结点:分支结点,内部结点,度不为0的结点。

以根结点为第一层,以此类推。

树的高度(深度):树中结点的最大层次。

结点的深度:从根结点开始计算,根结点深度为1。

结点的高度:从底层叶子结点开始计算,叶子结点高度为1。

有序树:树中结点子树从左到右有序,不能交换。

丰满树:出最底层外,其他层都是满的。

森林:若干棵互不相交的树的集合。

5.2 树的存储结构

双亲存储结构:一种顺序存储结构,知道了i,tree[i]为其双亲结点。

孩子存储结构:同图中的邻接表存储。

5.3 二叉树的相关的基本概念

一般的树加上如下的两个限制条件,就得到了二叉树:每个结点最多只有两棵子树,即二叉树中结点的度只能为0,1以及2;子树有左右之分,不能颠倒。

满二叉树:所有的分支结点都有左孩子和右孩子结点,并且叶子结点都集中在二叉树的最下层,这样的二叉树称为满二叉树。对满二叉树编号:编号从1开始,从上到下、从左到右进行。

完全二叉树:一棵深度为K有n个结点的二叉树进行编号后,各结点的编号与深度为K的满二叉树上相同位置的结点的编号相同。一棵完全二叉树一定是由一棵满二叉树从右至左、从下至上挨个删除结点所得到的。

5.4 二叉树的主要性质

1.非空二叉树上叶子结点数等于双分支结点数加1,即总分支数 = 总结点数 - 1

2.二叉树的第i层上最多有

(i >= 1)个结点

3.高度(或深度)为K的二叉树最多有

个结点,换句话说:满二叉树中前K层结点个数为:


4.有n个结点的完全二叉树,对各结点从上到下,从左到右依次编号(范围1~n),则结点之间的关系,若i为某结点编号,则:

若i≠1,双亲编号⌊i/2⌋;

若2i≤n,左孩子为2i,若2i>n,无左孩子;

若2i+1≤n,右孩子为2i+1,若2i+1>n,无右孩子;

5.n个结点,构成h(n)种不同的二叉树,则:



6.n个结点的完全二叉树高度(深度)为:


5.5 二叉树的存储结构

顺序存储:最适合于完全二叉树,使用顺序存储结构要从数组下标为1开始。这里要注意区分树的顺序存储结构和二叉树的顺序存储结构:

树:数组下标代表结点的编号,内容表示结点之间的关系;

二叉树:数组下标既指示了编号又指示了关系。

链式存储:



typedef struct BTNode {
char data;
struct BTNode *lchild;
struct BTnode *rchild;
}BTNode;


5.6 树、森林与二叉树的转换

将树转换为二叉树:同一结点的各孩子结点用线串起来,将每个结点的分支从左往右除了第一个以外,其余全部剪掉,擦掉虚线,连成实线,得到二叉树。

【例子1】树转换为二叉树





将森林转换为二叉树:根据孩子兄弟的法则,根结点没有右兄弟,所以转换为二叉树没有右孩子。将森林中第二棵树转换成的二叉树,当作第一棵树的右子树,依此类推。

【例子2】森林转换为二叉树







5.7 二叉树的遍历算法

包括:先序遍历、中序遍历、后序遍历和层次遍历。

先序遍历:

如果二叉树为空数,什么都不做。

否则,访问根节点->先序遍历左子树->先序遍历右子树

/* pre order by recursion method */
void preOrder(BTNode *p) {
if (p != null) {
visit(p->data);
preOrder(p->lchild);
preOrder(p->rchild);
}
}

/* pre order by no recursion method */
void preOrder(BTNode *p) {
Stack <BTNode *> s;
BTNode *q;
q = p;
s.initial();
while(q != null || !s.empty()) {
if (q != null) {
visit(q->data);
s.push(q);
q = q->lchild;
}
else {
s.pop(q);
q = q->rchild;
}
}
}


中序遍历:

如果二叉树为空数,什么都不做。

否则,中序遍历左子树->访问根结点->中序遍历右子树

/* in order by recursion method */
void inOrder(BTNode *p) {
if (p != null) {
inorder(p->lchild);
visit(p->data);
inorder(p->rchild);
}
}

/* in order by no recursion method */
void inOrder(BTNode *p) {
Stack <BTNode *> s;
BTNode *q = p;
s.initial();
while(q != null || !s.empty()) {
if (q != null) {
s.push(q);
q = q->lchild;
}
else {
s.pop(q);
visit(q->data);
q = q->rchild;
}
}
}


后序遍历:

如果二叉树为空数,什么都不做。

否则,后序遍历左子树->后序遍历右子树->访问根结点

/* post order by recursion method */
void postOrder(BTNode *p) {
if
4000
(p != null) {
postOrder(p->lchild);
postOrder(p->rchild);
visit(p->data);
}
}

/* post order by no recursion method */
void postOrder(BTNode *p) {
Stack <BTNode *> s;
Stack <int> tag;
BTNode *q = p;
int f;
s.initial();
tag.initial();
while(q != null || !s.empty()) {
if (q != null) {
s.push(q);
q = q->lchild;
tag.push(1);
}
else {
s.pop(q);
tag.pop(f);
if (f == 1) {
s.push(q);
tag.push(2);
q = q->rchild;
}
else {
visit(q->data);
q = null;
}
}
}
}


层次遍历:

按照一定的方向(如从左至右,从上至下)每一层次对二叉树各个结点进行访问。要进行层次遍历,需要建立一个循环队列,先将二叉树头结点入队列,然后出队列,访问该结点,如果有左子树,则左子树根结点入队;如果有右子树,则右子树根结点入队。出队列,访问出队列结点,如此反复直到队列空为止。

void levelOrder(BTNode *p) {
Queue <BTNode *> q;
BTNode *r;
q.initial();
if (p != null) {
q.push(p);
while(!q.empty()) {
q.pop(r);
visit(r->data);
if (r->lchild != null) {
q.push(r->lchild);
}
if (r->rchild != null) {
q.push(r->rchild);
}
}
}
}


【例子3】二叉树的遍历结果



先序遍历:A->B->C->D->E->F->G->H

中序遍历:C->B->E->D->F->A->H->G

后序遍历:C->E->F->D->B->H->G->A

层次遍历:A->B->G->C->D->H->E->F

5.8 树和森林的遍历算法

树的遍历:

先根遍历:先访问根结点、再访问子树。

后根遍历:先访问子树,再访问根结点。

树的先根遍历对应二叉树的先序遍历。

树的后根遍历对应二叉树的中序遍历。

森林的遍历:

先序遍历:对应二叉树的先序遍历,先访问第一棵树的根结点,先序遍历第一棵树中根结点的子树,先序遍历森林中除去第一棵树的其他树。

中序遍历:对应二叉树的中序遍历,中序遍历第一棵树根结点的子树,访问第一棵树的根结点,中序遍历森林中除去第一棵树的其他树。

5.9 线索二叉树



ltag=0:lchild为指针,指向结点左孩子;ltag=1,表示lchild为线索,指向结点直接前驱。

rtag=0:rchild为指针,指向结点右孩子;rtag=1,表示rchild为线索,指向结点直接后驱。

typedef struct TBTNode {
char data;
int ltag, rtag;
struct TBTNode *lchild;
struct TBTNode *rchild;
} TBTNode;


5.10 二叉排序树(BST)

这部分内容主要应用在“查找或者排序部分”。二叉排序树或者是空树,或者是满足以下性质的二叉树:

若左子树不空,则左子树所有值 < 根

若右子树不空,则右子树所有值 > 根

左右子树各是一棵二叉排序树

输出二叉排序树的中序遍历,则该输出序列为递增序列。

typedef struct BTNode {
int key;
struct BTNode *lchild;
struct BTNode *rchild;
} BTNode;


5.11 平衡二叉树(AVL)

这部分内容主要应用在“查找或者排序部分”。

左右子树都是平衡二叉树,并且左右子树的高度之差的绝对值不超过1(引入了平衡因子的概念)。

一个结点的平衡因子:左子树高度 - 右子树高度。取值:-1,0,1

当失去平衡的最小子树被调整为平衡子树之后,无需调整原有其他所有不平衡子树,整个二叉排序树会成为一棵平衡二叉树。

最小子树:以距离插入结点最近,且平衡因子绝对值大于1的结点作为根的子树。

将失去平衡的二叉树进行平衡调整有4种情况:LL型、RR型、LR型和RL型。

LL型:在左子树根结点的右子树上插入结点 -> 右旋

LR型:在左子树根结点的右子树上插入结点 -> 左旋 + 右旋

RR型:在右子树根结点的右子树上插入结点 -> 左旋

RL型:在右子树根结点的左子树上插入结点 -> 右旋 + 左旋

【例子4】平衡二叉树的插入删除和平衡调整

以关键字{16、3、7、11、9、26、18、14、15}构造一棵AVL树,构造完成后依次删除16、15、11

插入部分:







删除部分:



5.12 B-树与B+树

B-树可以看作是二叉排序树的扩展,二叉排序树是二路查找,B-树的多路查找。因为B-树结点内的关键字是有序的,在结点内查找的时候除了顺序查找外,可以用折半查找。B-树需要满足以下条件:

每个结点最多有m个分支(子树);而最少分支棵树要看是否为根结点,根结点最少两个分支,非根结点最少有

个分支;

有n个分支的结点有n-1个关键字,从左至右递增顺序排列;

各个底层是叶结点,叶结点下面是失败结点(空指针表示)。

B+树是B-树的一种变形。它们之间的差别主要有:

B+树中,n个关键字的结点含有n个分支,B-树中有n+1个分支;

B+树中叶子结点包含信息,并且包含了全部关键字,B-树的叶子只包含关键字(索引)

由于这里并不是考研重点考察的部分,所以关于B+树和B-树的详细操作会在后面的文章中单独描述。



5.13 哈夫曼树和哈夫曼编码

哈夫曼树是最优二叉树,带权路径最短。

路径:树中一个结点到另一个结点分支构成的路线。

路径长度:路径上的分支数目。

树的路径长度:从根到每个结点的路径长度之和。

带权路径长度:结点有权值,结点到根之间的路径长度乘以结点的权值。

**树的带权路径长度:**WPL,树中所有叶子结点带权路径长度之和。

哈夫曼树的特点:权值越大的结点,距离根结点越近。树中没有度为1的结点的哈夫曼树称为严格(正则)二叉树。

哈夫曼树的构造方法:

给定n个权值

(1)将n个权值看作只有根的n棵二叉树,集合记为F。

(2)F中挑选两棵根结点权值最小的(a, b)作为左右子树,构成新树c。

(3)F中删除a与b,加入c。

【例子5】哈夫曼树的构建



哈夫曼编码:

前缀编码:任一字符的编码都不是另一个字符编码的前缀。

而哈夫曼编码就是长度最短的前缀编码。对构造好的哈夫曼树,左分支表示0,右分支表示1(根据题目要求来)

【例子6】哈夫曼编码

A、B、C、D的权值(或者出现频率)为0.4、0.3、0.1和0.2,求哈夫曼编码。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息