您的位置：首页 > 理论基础 > 数据结构算法

数据结构看书笔记（六）--树的定义、抽象数据类型、存储结构

2016-10-21 18:34 281 查看

树：
树（Tree）是n(n>=0)个结点的有限集。n=0时称为空树，在任意一颗非空树中：（1）有且只有一个特定的称之为根（Root）的结点；（2）当n>1时，其余结点可分为m(m>0)个互不相交的有限集T1、T2、……、Tm,其中每一个集合本身又是一棵树，并且称为根的子树(SubTree).

对于树的定义还要强调两点：
1.n>0时根结点是唯一的，不可能存在多个根结点,应与现实中的大树区分开
2.m>0时，子树的个数没有限制，但它们一定是互不相交的。

结点分类：
结点拥有的子树称为结点的度(Degree).度为0的结点称为叶结点(Leaf)或终端结点；度不为0的结点称为非终端结点或分支结点。除根结点外，分支节点也称为内部结点。树的度是树内各结点的度的最大值。

结点间关系：
结点的子树的根称为该节点的孩子(Child),相应地，该结点称为孩子的双亲(Parent).
同一个双亲的孩子之间的互称兄弟(Sibling).
结点的祖先是从根到该节点所经分支上的所有节点。
以某结点为根的子树中的任一结点都称为该结点的子孙。

树的其他相关概念：
结点的层次(Level)从根开始定义起，根为第一层，根的孩子为第二层。
双亲在同一层的结点互为堂兄弟。
树中结点的最大层次称为树的深度(Depth)或高度。

如果将树中结点的各子树看成从左至右是有次序的，不能互换的，则称该数为有序树，否则称为无序树。
森林(Forest)是m(m>=0)棵互不相交的树的集合。

对比线性表与树的结构：
线性结构：
第一个数据元素：无前驱
最后一个数据元素：无后继
中间元素：一个前驱一个后继
树结构：
根结点：无双亲，唯一
叶结点：无孩子，可以多个
中间结点：一个双亲多个孩子（或一个孩子）

树的抽象数据类型：
ADT 树(Tree)
Data
树是由一个根结点和若干棵子树构成。树中结点具有相同数据类型及层次关系。
Operation
InitTree(*T):构造空树T.
DestroyTree(*T):销毁树T.
CreateTree(*T,definition):按difinition中给出树的定义来构造树。
ClearTree(*T):若树T存在，则将树T清为空树。
TreeEmpty(T):若T为空树，返回true，否则返回false.
TreeDepth(T):返回T的深度。
Root(T):返回T的根结点。
Value(T,cur_e):cur_e是树T中的一个结点，返回此结点的值。
Assign(T,cur_e,value):给树T的结点cur_e赋值为value.
Parent(T,cur_e):若cur_e是树的非根结点，则返回它的双亲，否则返回空。
LeftChild(T,cur_e):若cur_e是树的非叶结点，则返回它的最左孩子，否则返回空。
RightSibling(T,cur_e):若cur_e有右兄弟，则返回它的右兄弟，否则返回空。
InsertChild(*T,*p,i,c):其中p指向树的某个结点，i为所指结点p的度加上1，非空树c与T不相交，操作结果为插入c为树T中p指结点的第i棵子树。
DeleteChild(*T,*p,i):其中p指向树T的某个结点，i为所指结点的p的度，操作结果为删除T中p所指结点的第i棵子树。
endADT

树的存储结构：
双亲表示法：我们假设以一组连续空间存储树的结点，同时在每个结点中，附设一个指示器指示其双亲结点在数组中的位置。---即每个结点除了知道自己是谁之外，还知道它的双亲在哪。
其结点结构如下所示：
|----------|-----------|
|data |parent |
|----------|-----------|

其中data为数据域，存储结点的数据信息，parent是指针域，存储该结点的双亲在数组中的下标。

以下为双亲表示法的结点结构定义代码：
#define MAX_TREE_SIZE 100
typedef int TElemType;
typedef struct PTNode
{
TElemType data;
int parent;
}PTNode;
typedef struct
{
PTNode nodes[MAX_TREE_SIZE];
int r,n;//根的位置和结点数
}PTree;

以下是一颗树的表示：
|-----------|-----------|-----------|
| 下标 | data | parent |
|-----------|-----------|-----------|
| 0 | A | -1 |
|-----------|-----------|-----------|
| 1 | B | 0 |
|-----------|-----------|-----------|
| 2 | C | 0 |
|-----------|-----------|-----------|
| 3 | D | 1 |
|-----------|-----------|-----------|
| 4 | E | 2 |
|-----------|-----------|-----------|
| 5 | F | 2 |
|-----------|-----------|-----------|
| 6 | G | 3 |
|-----------|-----------|-----------|
| 7 | H | 3 |
|-----------|-----------|-----------|
| 8 | I | 3 |
|-----------|-----------|-----------|
| 9 | J | 4 |
|-----------|-----------|-----------|

此外还可以有以下类型的表示法（只是一部分）：
|-----------|-----------|-----------|-----------|
| 下标 | data | parent | firstChild|
|-----------|-----------|-----------|-----------|

|-----------|-----------|-----------|-----------|
| 下标 | data | parent | rightsib |
|-----------|-----------|-----------|-----------|

存储结构的设计师一个非常灵活的过程，一个存储结构设计得是否合理，取决于基于该存储结构的运算是否合适、是否方便，时间复杂度好不好等。

孩子表示法：
多重链表表示法：每个结点由多个指针域，其中每个指针指向一棵子树的根结点，我们把这种方法叫做多重链表表示法。
以下有两种方案解决孩子个数不同的问题。
方案一：
|----------|-----------|-----------|-----------|-----------|-----------|
|data | child1 | child2 | child3 | ………… | childn |
|----------|-----------|-----------|-----------|-----------|-----------|

其中data为数据域，child1到childn为指针域，用来指向该结点的孩子结点。
优缺点分析：这种方法对于树中各结点的度相差很大时，显然是浪费空间的，因为有很多的结点，其指针域都是空的，但是如果各个结点的度相差不大时，就意味着空间被充分的利用了，这时存储结构的缺点反而变成了优点。

鉴于上述第一种方案可能带来空间上的浪费的问题，我们提出了方案二：
方案二：
第二种方案每个结点指针域的个数等于该结点的度，我们专门取一个位置来存储结点指针域的个数，其结构如下
|----------|-----------|-----------|-----------|-----------|-----------|-----------|
|data | degree | child1 | child2 | child3 | ………… | childn |
|----------|-----------|-----------|-----------|-----------|-----------|-----------|
其中data为数据域，degree为度域，也就是存储该结点的孩子结点的个数，child1到childn为指针域，指向该结点的各个孩子的结点。
优缺点分析：这种方案客服了浪费空间的缺点，对空间的利用率是很高了，但是由于各个结点的链表是不相同的结构，加上要维护结点的度的数值，在运算上就会带来时间上的损耗。

鉴于上述的多重链表表示法的两种方案都不是很适合，所以我们引入孩子表示法这个概念：
具体的办法就是，把每个结点的孩子结点排列起来，以单链表作存储结构，则n个结点有n个孩子链表，如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表，采用顺序存储结构，存放进一个一维数组中，具体的表示如下所示

|------|------|-----------| |-------|------|
| 下标 | data | firstChild| |child |next |
|--------|--------|-------------| |-------|------| |----|----|
| 0 | A | | ==> |1 | |==> |2 | ^ |
|--------|--------|-------------| |-------|------| |----|----|
| 1 | B | | ==> |3 |^ |
|--------|--------|-------------| |-------|------| |----|----|
| 2 | C | | ==> |4 | |==> |5 | ^ |
|------|------|-----------| |-------|------| |----|----| |----|----|
| 3 | D | | ==> |6 | |==> |7 | |==> |8 |^ |
|------|------|-----------| |-------|------| |----|----| |----|----|
| 4 | E | | ==> |9 |^ |
|------|------|-----------| |-------|------|
| 5 | F | ^ |
|------|------|-----------|
| 6 | G | ^ |
|------|------|-----------|
| 7 | H | ^ |
|------|------|-----------|
| 8 | I | ^ |
|------|------|-----------|
| 9 | J | ^ |
|------|------|-----------|

为此需要设计两种结点结构，一个是孩子链表的孩子结点
|-------|------|
|child |next |
|-------|------|
其中child是数据域，用来存储某个结点在表头数组中的下标，next是指针域，用来存储指向某结点的下一个孩子结点的指针。
另一个是表头数组的表头结点
|------|-----------|
| data | firstChild|
|------|-----------|
其中data为数据域，存储某结点的数据信息，firstchild是头指针域，存储该结点的孩子链表的头指针。

以下为孩子表示法的结构定义代码：
#define MAX_TREE_SIZE 100
typedef struct CTNode
{
int child;
struct CTNode *next;
}*ChildPtr;
typedef struct
{
TElemType data;
ChildPtr firstchild;
}CTBox;
typedef struct
{
CTBox nodes[MAX_TREE_SIZE];
int r,n;//根的位置和结点数
}CTree;

以上的结构对于我们要查找某个结点的某个孩子，或者找某个结点的兄弟，只需要查找这个结点的孩子单链表即可，对于遍历整棵树也是很方便的，对头结点的数组循环即可。

如果需要查找某个结点的双亲结点是谁的话，则可以考虑一下这种结构
|------|------|------|-----------| |-------|------|
| 下标 | data |parent| firstChild| |child |next |
|------|------|------|-----------| |-------|------| |----|----|
| 0 | A |-1 | | ==> |1 | |==> |2 | ^ |
|------|------|------|-----------| |-------|------| |----|----|
| 1 | B |0 | | ==> |3 |^ |
|------|------|------|-----------| |-------|------| |----|----|
| 2 | C |0 | | ==> |4 | |==> |5 | ^ |
|------|------|------|-----------| |-------|------| |----|----| |----|----|
| 3 | D |1 | | ==> |6 | |==> |7 | |==> |8 |^ |
|------|------|------|-----------| |-------|------| |----|----| |----|----|
| 4 | E |2 | | ==> |9 |^ |
|------|------|------|-----------| |-------|------|
| 5 | F |2 | ^ |
|------|------|------|-----------|
| 6 | G |3 | ^ |
|------|------|------|-----------|
| 7 | H |3 | ^ |
|------|------|------|-----------|
| 8 | I |3 | ^ |
|------|------|------|-----------|
| 9 | J |4 | ^ |
|------|------|------|-----------|

以上的表示法称为双亲孩子表示法

孩子兄弟表示法：
任意一棵树，它的结点的第一个孩子如果存在就是唯一的，它的右兄弟如果存在也是唯一的。因此，我们设置两个指针，分别指向该结点的第一个孩子和此结点的右兄弟。
|-----------|-----------|-----------|
| data | firstchild| rightsib |
|-----------|-----------|-----------|
其中data为数据域，firstchild为指针域，存储该结点的第一个孩子结点的存储地址，rightsib是指针域，存储该结点的右兄弟结点的存储地址。
结构定义代码如下。
typedef struct CSNode
{
TElemType data;
struct CSNode *firstchild,*rightsib;
}CSNode,*CSTree;

分析：这种表示法，给查找某个结点的某个孩子带来了方便，只需要通过firstchild找到此结点的长子，然后再通过长子结点的rightsib找到它的二弟，接着一直下去，知道找到具体的孩子。当然，如果想找某个结点的双亲，这个表示法也是有缺陷的。当然也可以增加一个双亲指针域来解决快速查找双亲的问题，这样其实表示出来的图示就是一个二叉树。二叉树的内容，放到下一复习小节。
树（Tree）是n(n>=0)个结点的有限集。n=0时称为空树，在任意一颗非空树中：（1）有且只有一个特定的称之为根（Root）的结点；（2）当n>1时，其余结点可分为m(m)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 数据结构树

相关文章推荐

新的分享

章节导航