数据结构——字符串和多维数组
2014-12-09 19:10
288 查看
第
4 章
字符串和多维数组
本章的基本内容是:
字符串。在程序设计语言中大都有串变量的概念,而且实现了基本的串操作,本章重点讨论串的存储结构及模式匹配算法。
数组。在程序设计语言中大都提供了数组作为构造数据类型,本章重点讨论数组以及特殊矩阵的存储与寻址。
4.1 字符串
主要内容
线性表——具有相同类型的数据元素的有限序列。
栈——仅在表的一端进行插入和删除操作。
队列——在一端进行插入操作,而另一端进行删除操作。
串——零个或多个字符组成的有限序列。
线性表——具有相同类型的数据元素的有限序列。
(多维)数组——线性表中的数据元素可以是线性表。
串的逻辑结构:
p串:零个或多个字符组成的有限序列。
p 串长度:串中所包含的字符个数。
p 空串:长度为0的串,记为:" "。
p非空串通常记为:
S=" s1 s2 …… sn "
其中:S是串名,双引号是定界符,双引号引起来的部分是串值 ,
si(1≤i≤n)是一个任意字符。
p子串:串中任意个连续的字符组成的子序列。
p主串:包含子串的串。
p子串的位置:子串的第一个字符在主串中的序号。
S1="ab12cd
"
S2="ab12"
S3="ab13"
S4="ab12φ"
S5=" "
S6="φφφ
"[/b]
p串的数据对象约束为某个字符集。
p 微机上常用的字符集是标准ASCII码,由 7 位二进制数表示一个字符,总共可以表示 128 个字符。
p 扩展ASCII码由 8 位二进制数表示一个字符,总共可以表示 256 个字符,足够表示英语和一些特殊符号,但无法满足国际需要。
Unicode由 16 位二进制数表示一个字符,总共可以表示 216个字符,能够表示世界上所有语言的所有字符,包括亚洲国家的表意字符。为了保持兼容性,Unicode字符集中的前256个字符与扩展ASCII码完全相同。
串的比较:通过组成串的字符之间的比较来进行的。
给定两个串:X="x1x2…xn"和Y="y1y2…ym",则:
1. 当n=m且x1=y1,…,xn=ym时,称X=Y;
2. 当下列条件之一成立时,称X<Y:
⑴ n<m且xi=yi(1≤
i≤n);
⑵存在k≤min(m,n),使得xi=yi(1≤i≤k-1)且xk<yk。
模式匹配:给定主串S="s1s2…sn"和模式T="t1t2…tm",在S中寻找T 的过程称为模式匹配。如果匹配成功,返回T 在S中的位置;如果匹配失败,返回0。
模式匹配问题有什么特点?
⑴算法的一次执行时间不容忽视:问题规模通常很大,常常需要在大量信息中进行匹配;
⑵算法改进所取得的积累效益不容忽视:模式匹配操作经常被调用,执行频率高。
模式匹配——BF(Back-Forward?)算法
1. 在串S和串T中设比较的起始下标i和j;
2. 循环直到S或T的所有字符均比较完
2.1 如果S[i]=T[j],继续比较S和T的下一个字符;
2.2 否则,将i和j回溯,准备下一趟比较;
3. 如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标;
否则,匹配失败,返回0;
int BF(char S[ ], char T[ ])
{
i=0; j=0;
while (S[i]!='\0'&&T[j]!='\0')
{
if (S[i]==T[j]) {
i++; j++;
}
else {
i=i-j+1; j=0;
}
}
if (T[j]=='\0') return (i-j+1);
else return 0;
}
int BF(char S[ ], char T[ ])
{
i=0; j=0;start=0;
while (S[i]!='\0'&&T[j]!='\0')
{
if (S[i]==T[j]) {
i++; j++;
}
else {
start++; i=start; j=0;
}
}
if (T[j]=='\0') return
start;
else return 0;
}
KMP算法的伪代码描述
1.
在串S和串T中分别设比较的起始下标i和j;
2.
循环直到S或T的所有字符均比较完
2.1 如果S[i]=T[j],继续比较S和T的下一个字符;否则
2.2 将j向右滑动到next[j]位置,即j=next[j];
2.3
如果j=-1,则将i和j分别加1,准备下一趟比较;
3.
如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0;
4.2
多维数组
主要内容
数组是由一组类型相同的数据元素构成的有序集合,每个数据元素称为一个数组元素(简称为元素),每个元素受n(n≥1)个线性关系的约束,每个元素在n个线性关系中的序号i1、i2、…、in称为该元素的下标,并称该数组为
n 维数组。
数组的特点
元素本身可以具有某种结构,属于同一数据类型;
数组是一个具有固定格式和数量的数据集合。
数组的基本操作
⑴ 存取:给定一组下标,读出对应的数组元素;
⑵ 修改:给定一组下标,存储或修改与其相对应的数组元素。
存取和修改操作本质上只对应一种操作——寻址
4.3 矩阵的压缩存储
主要内容
特殊矩阵和稀疏矩阵
p特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
p 稀疏矩阵:矩阵中有很多零元素。
p压缩存储的基本思想是:
⑴ 为多个值相同的元素只分配一个存储空间;
⑵ 对零元素不分配存储空间。
本章总结
4 章
字符串和多维数组
本章的基本内容是:
字符串。在程序设计语言中大都有串变量的概念,而且实现了基本的串操作,本章重点讨论串的存储结构及模式匹配算法。
数组。在程序设计语言中大都提供了数组作为构造数据类型,本章重点讨论数组以及特殊矩阵的存储与寻址。
4.1 字符串
4.11 字符串的定义 |
4.12 字符串的存储结构 |
4.13 模式匹配 |
线性表——具有相同类型的数据元素的有限序列。
栈——仅在表的一端进行插入和删除操作。
队列——在一端进行插入操作,而另一端进行删除操作。
串——零个或多个字符组成的有限序列。
线性表——具有相同类型的数据元素的有限序列。
(多维)数组——线性表中的数据元素可以是线性表。
串的逻辑结构:
p串:零个或多个字符组成的有限序列。
p 串长度:串中所包含的字符个数。
p 空串:长度为0的串,记为:" "。
p非空串通常记为:
S=" s1 s2 …… sn "
其中:S是串名,双引号是定界符,双引号引起来的部分是串值 ,
si(1≤i≤n)是一个任意字符。
p子串:串中任意个连续的字符组成的子序列。
p主串:包含子串的串。
p子串的位置:子串的第一个字符在主串中的序号。
S1="ab12cd
"
S2="ab12"
S3="ab13"
S4="ab12φ"
S5=" "
S6="φφφ
"[/b]
p串的数据对象约束为某个字符集。
p 微机上常用的字符集是标准ASCII码,由 7 位二进制数表示一个字符,总共可以表示 128 个字符。
p 扩展ASCII码由 8 位二进制数表示一个字符,总共可以表示 256 个字符,足够表示英语和一些特殊符号,但无法满足国际需要。
Unicode由 16 位二进制数表示一个字符,总共可以表示 216个字符,能够表示世界上所有语言的所有字符,包括亚洲国家的表意字符。为了保持兼容性,Unicode字符集中的前256个字符与扩展ASCII码完全相同。
串的比较:通过组成串的字符之间的比较来进行的。
给定两个串:X="x1x2…xn"和Y="y1y2…ym",则:
1. 当n=m且x1=y1,…,xn=ym时,称X=Y;
2. 当下列条件之一成立时,称X<Y:
⑴ n<m且xi=yi(1≤
i≤n);
⑵存在k≤min(m,n),使得xi=yi(1≤i≤k-1)且xk<yk。
模式匹配:给定主串S="s1s2…sn"和模式T="t1t2…tm",在S中寻找T 的过程称为模式匹配。如果匹配成功,返回T 在S中的位置;如果匹配失败,返回0。
模式匹配问题有什么特点?
⑴算法的一次执行时间不容忽视:问题规模通常很大,常常需要在大量信息中进行匹配;
⑵算法改进所取得的积累效益不容忽视:模式匹配操作经常被调用,执行频率高。
模式匹配——BF(Back-Forward?)算法
1. 在串S和串T中设比较的起始下标i和j;
2. 循环直到S或T的所有字符均比较完
2.1 如果S[i]=T[j],继续比较S和T的下一个字符;
2.2 否则,将i和j回溯,准备下一趟比较;
3. 如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标;
否则,匹配失败,返回0;
int BF(char S[ ], char T[ ])
{
i=0; j=0;
while (S[i]!='\0'&&T[j]!='\0')
{
if (S[i]==T[j]) {
i++; j++;
}
else {
i=i-j+1; j=0;
}
}
if (T[j]=='\0') return (i-j+1);
else return 0;
}
int BF(char S[ ], char T[ ])
{
i=0; j=0;start=0;
while (S[i]!='\0'&&T[j]!='\0')
{
if (S[i]==T[j]) {
i++; j++;
}
else {
start++; i=start; j=0;
}
}
if (T[j]=='\0') return
start;
else return 0;
}
KMP算法的伪代码描述
1.
在串S和串T中分别设比较的起始下标i和j;
2.
循环直到S或T的所有字符均比较完
2.1 如果S[i]=T[j],继续比较S和T的下一个字符;否则
2.2 将j向右滑动到next[j]位置,即j=next[j];
2.3
如果j=-1,则将i和j分别加1,准备下一趟比较;
3.
如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0;
4.2
多维数组
4.21 数组的定义 |
4.22 数组的存储结构与寻址 |
n 维数组。
数组的特点
元素本身可以具有某种结构,属于同一数据类型;
数组是一个具有固定格式和数量的数据集合。
数组的基本操作
⑴ 存取:给定一组下标,读出对应的数组元素;
⑵ 修改:给定一组下标,存储或修改与其相对应的数组元素。
存取和修改操作本质上只对应一种操作——寻址
4.3 矩阵的压缩存储
4.31 对称矩阵的压缩存储 |
4.32 三角矩阵的压缩存储 |
4.33 对称矩阵的压缩存储 |
4.34 稀疏矩阵的压缩存储 |
p特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
p 稀疏矩阵:矩阵中有很多零元素。
p压缩存储的基本思想是:
⑴ 为多个值相同的元素只分配一个存储空间;
⑵ 对零元素不分配存储空间。
本章总结
相关文章推荐
- 数据结构 第四章 字符串和多维数组
- 数据结构思维导图——第四章:字符串和多维数组
- Java之美[从菜鸟到高手演变]之数据结构基础、线性表、栈和队列、数组和字符串
- 《数据结构》第四章-字符串和多维数组-知识结构导图
- Java之数据结构基础、线性表、栈和队列、数组和字符串,树—学习笔记
- 数据结构之多维数组理解
- 数据结构和算法 (二)数据结构基础、线性表、栈和队列、数组和字符串
- 再回首,数据结构——字符串与数组的常见操作(链式存储,包含朴素匹配算法等)
- 第四章字符串和多维数组结构导图
- 【数据结构与算法的语言基础】数组与字符串
- Java之美[从菜鸟到高手演变]之数据结构基础、线性表、栈和队列、数组和字符串
- 再回首,数据结构——字符串与数组的常见操作(顺序存储)
- 数据结构与算法2:字符串与数组
- 数据结构之数组和字符串的反转java实现
- 字符串和多维数组结构导图
- 《数据结构》第四章 字符串和多维数组 知识结构导图——信管1133-09
- 数组字符串系列之:判断一个输入字符串中的每个字符唯一,只能使用基本的数据结构
- Java之数据结构基础、线性表、栈和队列、数组和字符串,树—学习笔记
- BZOJ3790 神奇项链 解题报告【字符串】【Manacher】【树状数组】【数据结构优化DP】
- Java之美[从菜鸟到高手演变]之数据结构基础、线性表、栈和队列、数组和字符串