数据分析技术—关系数据库理论
2014-05-16 10:43
302 查看
现在开始学习数据分析的一系列理论与技术
慢慢一些技术会发表到博客
形式化关系查询语言
关系代数是一种过程化的查询语言,它包含一个运算的集合,这些运算以一个或两个关系为输入,产生一个新的关系作为结果。关系代数基本运算有:选择,投影,并,集合差,笛卡尔积和更名。还有一些其他运算比如,集合交,自然连接和赋值。可以运用基本运算来定义这些运算。
基本运算:
选择,投影和更名称为一元运算,因为他们对一个关系进行运算,另外三个运算对两个关系进行运算,因而称为二元运算。
选择运算(Select):选出满足给定谓词的元组sigma(δ)来表示选择,而将谓词写作δ的下标。例如
δdept_name=’Physics’(instructor)
表示的是:选择关系instructor中属于'物理'系的那些元组
通常我们允许在选择谓词中进行比较,使用的是=,!=,>,<等另外我们可以用连词and(Λ),or(ν),nor(¬)将多个谓词合并为一个较大的谓词
投影运算(Projection):投影运算是一元运算,他返回作为参数的关系,但把某些属性排除在外,由于关系是一个集合,所以所有重复的行均被去除。用pi(П)表示
例如:ПID,name,salary(instructor)列出所有教师的ID,name,salary
关系运算的组合:一般来说,由于关系代数的结果同其输入的类型一样,仍为关系,所以我们可以把多个关系运算组合成一个关系表达是(relational-algebra expression)
例如:Пname(δdept_name='Physics'(instructor))
并运算:(Union)
将两个集合并起来,我们需要保证并运算的关系是相容的。因此要是并运算rUs有意义,我们要求一下两个条件同时成立:
1 关系r和s必须是同元的,即他们的属性数目必须相同
2 对所有的i,r的第i个属性的域必须和s的第i个属性的域相同
注意:r和s可以是数据库关系或者作为关系代数表达式结果的临时关系
集合差运算
用-表示的集合差运算(Set-Difference)运算使得我们可以找出一个关系中而不在另一个关系中的那些元组。表达式r-s的结果即包含所有在r中而不在s中的元组关系
要使差运算有意义:要求关系r和s是同元的,且对于所有的i,r的第i个属性的域和s的第i个属性的域都相同
笛卡尔积运算
用X表示笛卡尔乘积(Cartesian-product)运算使得我们可以将任意两个关系的信息组合在一起。例如rXs。
更名运算
我们可以通过小写希腊字母rho(ρ )表示更名(rename)yu运算完成这一任务对给定关系代数表达式E,表达式px(E)返回表达式的结果,并把名字x赋给了它
未完待续!!!
慢慢一些技术会发表到博客
形式化关系查询语言
关系代数是一种过程化的查询语言,它包含一个运算的集合,这些运算以一个或两个关系为输入,产生一个新的关系作为结果。关系代数基本运算有:选择,投影,并,集合差,笛卡尔积和更名。还有一些其他运算比如,集合交,自然连接和赋值。可以运用基本运算来定义这些运算。
基本运算:
选择,投影和更名称为一元运算,因为他们对一个关系进行运算,另外三个运算对两个关系进行运算,因而称为二元运算。
选择运算(Select):选出满足给定谓词的元组sigma(δ)来表示选择,而将谓词写作δ的下标。例如
δdept_name=’Physics’(instructor)
表示的是:选择关系instructor中属于'物理'系的那些元组
通常我们允许在选择谓词中进行比较,使用的是=,!=,>,<等另外我们可以用连词and(Λ),or(ν),nor(¬)将多个谓词合并为一个较大的谓词
投影运算(Projection):投影运算是一元运算,他返回作为参数的关系,但把某些属性排除在外,由于关系是一个集合,所以所有重复的行均被去除。用pi(П)表示
例如:ПID,name,salary(instructor)列出所有教师的ID,name,salary
关系运算的组合:一般来说,由于关系代数的结果同其输入的类型一样,仍为关系,所以我们可以把多个关系运算组合成一个关系表达是(relational-algebra expression)
例如:Пname(δdept_name='Physics'(instructor))
并运算:(Union)
将两个集合并起来,我们需要保证并运算的关系是相容的。因此要是并运算rUs有意义,我们要求一下两个条件同时成立:
1 关系r和s必须是同元的,即他们的属性数目必须相同
2 对所有的i,r的第i个属性的域必须和s的第i个属性的域相同
注意:r和s可以是数据库关系或者作为关系代数表达式结果的临时关系
集合差运算
用-表示的集合差运算(Set-Difference)运算使得我们可以找出一个关系中而不在另一个关系中的那些元组。表达式r-s的结果即包含所有在r中而不在s中的元组关系
要使差运算有意义:要求关系r和s是同元的,且对于所有的i,r的第i个属性的域和s的第i个属性的域都相同
笛卡尔积运算
用X表示笛卡尔乘积(Cartesian-product)运算使得我们可以将任意两个关系的信息组合在一起。例如rXs。
更名运算
我们可以通过小写希腊字母rho(ρ )表示更名(rename)yu运算完成这一任务对给定关系代数表达式E,表达式px(E)返回表达式的结果,并把名字x赋给了它
未完待续!!!
相关文章推荐
- 数据挖掘 多维分析技术理论基础知识
- IDS中的数据分析技术简述
- 数据实时同步或抽取上收的技术分析(社保、电力营销、财政、税务征管、公安警务等地市数据省级大集中应用/异地灾备)
- 测试数据创建管理及源代码分析技术研讨会
- 技术角度分析:中国谁能玩转大数据(转)
- 技术角度分析:中国谁能玩转大数据
- 面向Web的数据挖掘 技术分析
- [转]利用数据挖掘技术分析用卡行为
- 数据挖掘技术在商业银行CRM中的应用理论与模型研究
- 【引用】内网安全数据保密技术分析与比较
- 技术角度分析:中国谁能玩转大数据
- GIS基本理论之四:空间数据分析基本理论
- 空间数据挖掘技术理论及方法
- 数据挖掘软件开发关键技术分析
- 测试数据创建管理及源代码分析技术研讨会
- 『第15天』网络监听技术分析 纯属理论
- 精细分析Oracle分布式系统数据复制技术
- 内网安全数据保密技术分析与比较
- 一个数据分析系统的技术架构设计浅析
- 空间数据挖掘技术理论及方法