第五章 树和二叉树
2014-07-16 22:24
281 查看
第五章 树和二叉树
一、树的逻辑结构
1.树的定义
树是n个结点(数据元素)的有限集合;
n=0时,空树;
n=1时,只有根结点的树;
n>1时,由一个根结点和若干互不相交的子树构成的树
2.树的逻辑关系
树是由一个根结点和若干子树构成,树中结点具有相同数据类型和层次关系
3.基本术语
(1)叶子结点:度为0的结点,也称终端结点
(2)分支结点:度不为0的结点,也称非终端结点
(3)孩子/双亲/兄弟结点:某结点子树的根结点称为该结点的孩子结点;该结点称为其孩子结点的双亲结点;具有同一个双亲的孩子结点互称兄弟结点
(4)路径:从双亲结点到孩子结点称为一条路径
(5)森林:m棵互不相交的树的集合
--------------------------------------------------------------------------
(1)结点的度:某结点的子树个数
(2)树的度:树中最大结点的度
(3)结点的层数:根结点的层数为1
(4)树的深度(高):树中最大结点的层数
(5)路径长度:某路径上经过的边数
4.树的遍历
(1)树的遍历是指从根结点出发,按照某种次序访问树中所有结点一次且仅一次
(2)遍历方式(3种):前序遍历(先根);后序遍历(后根);层序遍历(逐层)
二、树的存储结构
1.双亲表示法
(1)存储方式:用一维数组存储;
(2)优点:方便求某结点的双亲和查找根结点等操作;
缺点:不能反映各兄弟结点之间的关系;
2.孩子表示法
(1)存储方式:用链表存储,有两种形式;
形式1:多重链表表示法,
链表中每个结点包括一个数据域和多个指针域,每个指针域指向一个孩子结点
形式2:孩子链表表示法,
表头结点:包括结点的数据信息和该结点的孩子链表的头指针
孩子结点:包括数据信息和指针域
孩子链表:包括一个表头结点和该结点的所有孩子结点;
孩子链表表示法是用多个孩子链表表示树,这些孩子链表的所有表头结点用数组存储,构成表头数组
(2)优点:不仅表示了孩子结点的信息,而且链在同一个单链表中的结点具有兄弟关系
缺点:查找双亲比较困难
3.双亲孩子表示法
综合了双亲表示法和孩子链表表示法,在孩子链表的基础上,将表头结点内容设置为:“结点的数据信息 + 结点的双亲结点在数组中的下标 + 该结点的孩子链表的头指针”
4.孩子兄弟表示法(二叉链表表示法)
优点:便于实现树的各种操作
三、二叉树的逻辑结构
1.二叉树的定义
二叉树是n个结点(数据元素)的有限集合;
n=0时,空二叉树;
n=1时,只有根结点的二叉树;
n=2时,根结点和左/右子树构成的二叉树
n>2时,根结点和两棵互不相交的左、右子树构成的二叉树
2.二叉树的逻辑关系
二叉树是由一个根结点和两棵互不相交的左右子树构成,二叉树中结点具有相同数据类型和层次关系
3.特殊二叉树
(1)斜树:所有结点都只有左子树的二叉树称为左斜树,所有结点都只有右子树的二叉树称为右斜树
特点:斜树的结点个数与树的深度相同
(2)满二叉树:所有分支结点都有左、右子树;所有叶子结点都在同层上
特点:只有度为0和2的结点;叶子只能出现在最下一层
(3)完全二叉树:按层序编号,未编满的二叉树
特点:叶子结点只能出现在最下两层,且最下层的叶子结点都集中在二叉树左侧连续的位置;度为1的结点最多只会有一个,且该节点只有左孩子
4.二叉树的性质
(1)二叉树的第i层上最多有个结点
(2)深度为k的二叉树中,最多有个结点,最少有k个结点
(3)0度结点比2度结点个数多1,
--------------------完全二叉树的性质------------------
(4)n个结点的完全二叉树的深度为
(5)若双亲结点编号为i,则左孩子编号2i,右孩子编号2i+1
若左孩子或者右孩子结点编号为i,则双亲结点编号为i/2
5.二叉树的遍历(4种)
前序遍历;中序遍历;后序遍历;层序遍历
特点:已知二叉树的前序和中序序列或者中序和后序序列,都可唯一确定这棵二叉树
但是已知前序和后序序列,不能唯一确定这棵二叉树
四、二叉树的存储结构
1.二叉树最常用的存储结构是二叉链表,此外还有三叉链表、线索表等
2.顺序存储结构
(1)基本思想:增添一些并不存在的空结点,使一般的二叉树成为一棵完全二叉树,这样层序编号就可以唯一反映结点之间的逻辑关系,编号为i的结点存储到下标为i-1的位置
(2)缺点:浪费存储空间,最坏情况是右斜树,深度为k的右斜树,只有k个结点,却要分配个存储单元
(3)试用场合:二叉树的顺序存储结构是按层序存储的,一般仅适合存储完全二叉树
3.二叉链表
(1)基本思想:另二叉树的每个结点对应一个链表结点,链表结点存放“二叉树结点数据信息+该结点的左孩子指针+该结点的右孩子指针”
(2)特点:在二叉链表中,若有n个结点,则有2n个指针域,其中只有n-1个指针域用来存储孩子结点的地址,剩余n+1个为空指针域
4.三叉链表
5.线索链表
(1)线索:利用二叉链表中的空指针域存放该结点在某种遍历序列中的前驱和后继结点的指针,这些前驱和后继结点的指针称为线索
(2)线索二叉树:加上线索的二叉树称为线索二叉树
(3)线索链表:加上线索的二叉链表称为线索链表
(4)标志位: 为了区分某结点的指针域存放的是指向孩子的指针还是指向前驱或后继的线索,每个结点再增设两个标识位ltag和rtag
(5)判断是否有左、右孩子,不能通过指针域是否为空来判断,要判断标志位是否为1
例:线索二叉树结点R没有左孩子的充要条件:R.ltag=1
五、二叉树的应用:哈夫曼树及编码
1.叶子结点的权值
是对叶子结点赋予的一个有意义的数值量
2.二叉树的带权路径长度
3.哈夫曼树
带权路径长度最小的二叉树(最优二叉树)
哈夫曼树的特点:
(1)对给定的n个权值构造的哈夫曼树中,有n个叶子结点,n-1个分支结点
(2)哈夫曼树可以不唯一,但它们具有相同的带权路径长度
(3)哈夫曼树中不存在度为1的结点
4.前缀编码
如果在一组编码中任一编码都不是其他任何一个编码的前缀,这组编码称为前缀编码
5.哈夫曼编码
构造一棵哈夫曼编码树,规定哈夫曼编码树的左分支代表0,右分支代表1,则从根结点到每个叶子结点所经过的路径组成的0和1的序列便为该叶子结点对应字符的编码,称为哈夫曼编码
哈夫曼编码的特点:
(1)采用哈夫曼树构造的编码是一种能使字符串的编码总长度最短的不等长编码
(2)哈夫曼编码是前缀编码
六、树、森林与二叉树的转换
1.讨论树、二叉树和森林的目的
将树、森林按二叉树的存储方式进行存储,并利用二叉树的算法解决树的有关问题
2.树和二叉树的比较
转换关系:两者之间具有一一对应的关系,可以相互转换,给定一棵树,可以找到唯一的二叉树与之对应
相同处:从物理结构上看,树的孩子兄弟表示法和二叉树的二叉链表是相同的,只是解释不同
不同处:(1)二叉树和树是两种树结构,二叉树不是度为2的树(左斜、右斜)
(2)具有3个结点的树有2种形态,而具有3个结点的二叉树有5种形态
3.树转换为二叉树
转换方法:
(1)加线:树中所有相邻兄弟结点之间加一条连线;
(2)去线:对树中的每个结点,只保留它与第一个孩子结点之间的连线,删去它与其他孩子结点之间的连线
(3)层次调整:以根结点为轴心,将树顺时针转动一定的角度,使之层次分明
转换特点:
(1)树中的父子关系变成二叉树中的左子树
树中的兄弟关系变成二叉树中的右子树
(2)由于树根结点无兄弟,所以转换的二叉树根结点无右子树
(3)树的前序遍历对应二叉树的前序遍历
树的后序遍历对应二叉树的中序遍历
4.森林转换为二叉树
转换方法:
(1)将森林中的每棵树转换成二叉树
(2) 从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子
转换特点:
(1)第一棵树的根结点作为二叉树的根结点,第一棵树的剩余结点作为二叉树的左子树,从第二棵树开始全部作为二叉树根结点的右子树
(2)森林的前序遍历对应二叉树的前序遍历
森林的后序遍历对应二叉树的中序遍历
5.二叉树转换为树或森林
判定目标:若二叉树根结点无右子树,转换成树;若有,转换成森林
转换方法:
(1)加线:若某结点x是其双亲y的左孩子,则把结点x的右孩子、右孩子的右孩子、……都与结点y连线
(2)去线:删去原二叉树中所有的双亲结点与右孩子结点的连线
(3)层次调整:整理由(1)、(2)两步所得到的树或森林,使之层次分明
附:计算题
1.一棵n个结点的满二叉树共有( )个叶子结点和( )个分支结点
2.高度为h的二叉树上只有0度和2度结点,该二叉树的结点数最多有( ),最少有()
3.具有100个结点的完全二叉树的叶子结点数为( 50 )
4.已知一棵度为3的树有2个1度结点,3个2度结点,4个3度结点,则该树中有(12 )个叶子结点
5.在具有n个结点的二叉链表中,共有(2n )个指针域,其中(n-1 )个指针域用于指向左右孩子没剩下的(n+1 )个指针域则是空的
6.在有n个叶子的哈夫曼树中,叶子结点总数为(n ),分支结点总数为(n-1 )
7.n个结点的二叉树深度最少为( ),最多为(n )
8.深度为k的完全二叉树至少有( )个结点,至多有( )个结点
9.设森林中有4棵树,树中结点的个数依次为n1,n2,n3,n4,则把森林转换成二叉树后,其根结点的右子树上有(n2+n3+n4)个结点,左子树上有(n1-1)个结点
10.为5个使用频率不等的字符设计哈夫曼编码,不可能的方案是( D )
A.000,001,010,011,1 B.0000,0001,001,01,1
C.000,001,01,10,11 D.00,100,101,111
11.已知完全二叉树的第8层有8个结点,则其叶结点数是( 68 )
12.前序序列为A,B,C且后序序列为C,B,A的二叉树共有(4 )种
13.3个结点可以组成(2 )种不同形态的树,(4 )种不同形态的二叉树
14.将一棵有100个结点的完全二叉树从上到下,从左到右依次结点编号,根结点的编号为1,则编号为45的结点的左孩子编号为(47 )
15.用5个权值{3,2,4,5,1}构造的哈弗曼树的带权路径长度为(33 )
一、树的逻辑结构
1.树的定义
树是n个结点(数据元素)的有限集合;
n=0时,空树;
n=1时,只有根结点的树;
n>1时,由一个根结点和若干互不相交的子树构成的树
2.树的逻辑关系
树是由一个根结点和若干子树构成,树中结点具有相同数据类型和层次关系
3.基本术语
(1)叶子结点:度为0的结点,也称终端结点
(2)分支结点:度不为0的结点,也称非终端结点
(3)孩子/双亲/兄弟结点:某结点子树的根结点称为该结点的孩子结点;该结点称为其孩子结点的双亲结点;具有同一个双亲的孩子结点互称兄弟结点
(4)路径:从双亲结点到孩子结点称为一条路径
(5)森林:m棵互不相交的树的集合
--------------------------------------------------------------------------
(1)结点的度:某结点的子树个数
(2)树的度:树中最大结点的度
(3)结点的层数:根结点的层数为1
(4)树的深度(高):树中最大结点的层数
(5)路径长度:某路径上经过的边数
4.树的遍历
(1)树的遍历是指从根结点出发,按照某种次序访问树中所有结点一次且仅一次
(2)遍历方式(3种):前序遍历(先根);后序遍历(后根);层序遍历(逐层)
二、树的存储结构
1.双亲表示法
(1)存储方式:用一维数组存储;
(2)优点:方便求某结点的双亲和查找根结点等操作;
缺点:不能反映各兄弟结点之间的关系;
2.孩子表示法
(1)存储方式:用链表存储,有两种形式;
形式1:多重链表表示法,
链表中每个结点包括一个数据域和多个指针域,每个指针域指向一个孩子结点
形式2:孩子链表表示法,
表头结点:包括结点的数据信息和该结点的孩子链表的头指针
孩子结点:包括数据信息和指针域
孩子链表:包括一个表头结点和该结点的所有孩子结点;
孩子链表表示法是用多个孩子链表表示树,这些孩子链表的所有表头结点用数组存储,构成表头数组
(2)优点:不仅表示了孩子结点的信息,而且链在同一个单链表中的结点具有兄弟关系
缺点:查找双亲比较困难
3.双亲孩子表示法
综合了双亲表示法和孩子链表表示法,在孩子链表的基础上,将表头结点内容设置为:“结点的数据信息 + 结点的双亲结点在数组中的下标 + 该结点的孩子链表的头指针”
4.孩子兄弟表示法(二叉链表表示法)
优点:便于实现树的各种操作
三、二叉树的逻辑结构
1.二叉树的定义
二叉树是n个结点(数据元素)的有限集合;
n=0时,空二叉树;
n=1时,只有根结点的二叉树;
n=2时,根结点和左/右子树构成的二叉树
n>2时,根结点和两棵互不相交的左、右子树构成的二叉树
2.二叉树的逻辑关系
二叉树是由一个根结点和两棵互不相交的左右子树构成,二叉树中结点具有相同数据类型和层次关系
3.特殊二叉树
(1)斜树:所有结点都只有左子树的二叉树称为左斜树,所有结点都只有右子树的二叉树称为右斜树
特点:斜树的结点个数与树的深度相同
(2)满二叉树:所有分支结点都有左、右子树;所有叶子结点都在同层上
特点:只有度为0和2的结点;叶子只能出现在最下一层
(3)完全二叉树:按层序编号,未编满的二叉树
特点:叶子结点只能出现在最下两层,且最下层的叶子结点都集中在二叉树左侧连续的位置;度为1的结点最多只会有一个,且该节点只有左孩子
4.二叉树的性质
(1)二叉树的第i层上最多有个结点
(2)深度为k的二叉树中,最多有个结点,最少有k个结点
(3)0度结点比2度结点个数多1,
--------------------完全二叉树的性质------------------
(4)n个结点的完全二叉树的深度为
(5)若双亲结点编号为i,则左孩子编号2i,右孩子编号2i+1
若左孩子或者右孩子结点编号为i,则双亲结点编号为i/2
5.二叉树的遍历(4种)
前序遍历;中序遍历;后序遍历;层序遍历
特点:已知二叉树的前序和中序序列或者中序和后序序列,都可唯一确定这棵二叉树
但是已知前序和后序序列,不能唯一确定这棵二叉树
四、二叉树的存储结构
1.二叉树最常用的存储结构是二叉链表,此外还有三叉链表、线索表等
2.顺序存储结构
(1)基本思想:增添一些并不存在的空结点,使一般的二叉树成为一棵完全二叉树,这样层序编号就可以唯一反映结点之间的逻辑关系,编号为i的结点存储到下标为i-1的位置
(2)缺点:浪费存储空间,最坏情况是右斜树,深度为k的右斜树,只有k个结点,却要分配个存储单元
(3)试用场合:二叉树的顺序存储结构是按层序存储的,一般仅适合存储完全二叉树
3.二叉链表
(1)基本思想:另二叉树的每个结点对应一个链表结点,链表结点存放“二叉树结点数据信息+该结点的左孩子指针+该结点的右孩子指针”
(2)特点:在二叉链表中,若有n个结点,则有2n个指针域,其中只有n-1个指针域用来存储孩子结点的地址,剩余n+1个为空指针域
4.三叉链表
5.线索链表
(1)线索:利用二叉链表中的空指针域存放该结点在某种遍历序列中的前驱和后继结点的指针,这些前驱和后继结点的指针称为线索
(2)线索二叉树:加上线索的二叉树称为线索二叉树
(3)线索链表:加上线索的二叉链表称为线索链表
(4)标志位: 为了区分某结点的指针域存放的是指向孩子的指针还是指向前驱或后继的线索,每个结点再增设两个标识位ltag和rtag
(5)判断是否有左、右孩子,不能通过指针域是否为空来判断,要判断标志位是否为1
例:线索二叉树结点R没有左孩子的充要条件:R.ltag=1
五、二叉树的应用:哈夫曼树及编码
1.叶子结点的权值
是对叶子结点赋予的一个有意义的数值量
2.二叉树的带权路径长度
3.哈夫曼树
带权路径长度最小的二叉树(最优二叉树)
哈夫曼树的特点:
(1)对给定的n个权值构造的哈夫曼树中,有n个叶子结点,n-1个分支结点
(2)哈夫曼树可以不唯一,但它们具有相同的带权路径长度
(3)哈夫曼树中不存在度为1的结点
4.前缀编码
如果在一组编码中任一编码都不是其他任何一个编码的前缀,这组编码称为前缀编码
5.哈夫曼编码
构造一棵哈夫曼编码树,规定哈夫曼编码树的左分支代表0,右分支代表1,则从根结点到每个叶子结点所经过的路径组成的0和1的序列便为该叶子结点对应字符的编码,称为哈夫曼编码
哈夫曼编码的特点:
(1)采用哈夫曼树构造的编码是一种能使字符串的编码总长度最短的不等长编码
(2)哈夫曼编码是前缀编码
六、树、森林与二叉树的转换
1.讨论树、二叉树和森林的目的
将树、森林按二叉树的存储方式进行存储,并利用二叉树的算法解决树的有关问题
2.树和二叉树的比较
转换关系:两者之间具有一一对应的关系,可以相互转换,给定一棵树,可以找到唯一的二叉树与之对应
相同处:从物理结构上看,树的孩子兄弟表示法和二叉树的二叉链表是相同的,只是解释不同
不同处:(1)二叉树和树是两种树结构,二叉树不是度为2的树(左斜、右斜)
(2)具有3个结点的树有2种形态,而具有3个结点的二叉树有5种形态
3.树转换为二叉树
转换方法:
(1)加线:树中所有相邻兄弟结点之间加一条连线;
(2)去线:对树中的每个结点,只保留它与第一个孩子结点之间的连线,删去它与其他孩子结点之间的连线
(3)层次调整:以根结点为轴心,将树顺时针转动一定的角度,使之层次分明
转换特点:
(1)树中的父子关系变成二叉树中的左子树
树中的兄弟关系变成二叉树中的右子树
(2)由于树根结点无兄弟,所以转换的二叉树根结点无右子树
(3)树的前序遍历对应二叉树的前序遍历
树的后序遍历对应二叉树的中序遍历
4.森林转换为二叉树
转换方法:
(1)将森林中的每棵树转换成二叉树
(2) 从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子
转换特点:
(1)第一棵树的根结点作为二叉树的根结点,第一棵树的剩余结点作为二叉树的左子树,从第二棵树开始全部作为二叉树根结点的右子树
(2)森林的前序遍历对应二叉树的前序遍历
森林的后序遍历对应二叉树的中序遍历
5.二叉树转换为树或森林
判定目标:若二叉树根结点无右子树,转换成树;若有,转换成森林
转换方法:
(1)加线:若某结点x是其双亲y的左孩子,则把结点x的右孩子、右孩子的右孩子、……都与结点y连线
(2)去线:删去原二叉树中所有的双亲结点与右孩子结点的连线
(3)层次调整:整理由(1)、(2)两步所得到的树或森林,使之层次分明
附:计算题
1.一棵n个结点的满二叉树共有( )个叶子结点和( )个分支结点
2.高度为h的二叉树上只有0度和2度结点,该二叉树的结点数最多有( ),最少有()
3.具有100个结点的完全二叉树的叶子结点数为( 50 )
4.已知一棵度为3的树有2个1度结点,3个2度结点,4个3度结点,则该树中有(12 )个叶子结点
5.在具有n个结点的二叉链表中,共有(2n )个指针域,其中(n-1 )个指针域用于指向左右孩子没剩下的(n+1 )个指针域则是空的
6.在有n个叶子的哈夫曼树中,叶子结点总数为(n ),分支结点总数为(n-1 )
7.n个结点的二叉树深度最少为( ),最多为(n )
8.深度为k的完全二叉树至少有( )个结点,至多有( )个结点
9.设森林中有4棵树,树中结点的个数依次为n1,n2,n3,n4,则把森林转换成二叉树后,其根结点的右子树上有(n2+n3+n4)个结点,左子树上有(n1-1)个结点
10.为5个使用频率不等的字符设计哈夫曼编码,不可能的方案是( D )
A.000,001,010,011,1 B.0000,0001,001,01,1
C.000,001,01,10,11 D.00,100,101,111
11.已知完全二叉树的第8层有8个结点,则其叶结点数是( 68 )
12.前序序列为A,B,C且后序序列为C,B,A的二叉树共有(4 )种
13.3个结点可以组成(2 )种不同形态的树,(4 )种不同形态的二叉树
14.将一棵有100个结点的完全二叉树从上到下,从左到右依次结点编号,根结点的编号为1,则编号为45的结点的左孩子编号为(47 )
15.用5个权值{3,2,4,5,1}构造的哈弗曼树的带权路径长度为(33 )
相关文章推荐
- 《数据结构》第五章 树和二叉树 知识总结导图
- 第五章 树和二叉树 知识导图
- 大话数据结构 code 第五章 02二叉树链式结构实现_BiTreeLink
- 数据结构 第五章 树和二叉树
- 数据结构第五章 树和二叉树 知识导图
- 第五章:树和二叉树的思维导图
- 数据结构 第五章 树和二叉树
- 第五章:树和二叉树
- 数据结构第五章树和二叉树
- 第五章:树和二叉树之赫夫曼树及其编码
- 数据结构 第五章 树和二叉树
- 《数据结构》第五章树和二叉树 树的操作示例代码1
- 第五章 树和二叉树 实验
- 第五章 树和二叉树 思维导图
- 【第五章·树和二叉树】思维导图
- 第五章:树和二叉树之算法设计题
- 第五章 树和二叉树翻转学习任务
- 数据结构 第五章 树和二叉树
- 第五章 树与二叉树 思维导图
- 数据结构第五章 树和二叉树 知识导图