您的位置:首页 > 数据库

数据库应用-Datalog

2015-11-17 01:48 435 查看

Relational Algebra

数据库系统中引入的relational algebra并不多,大部分可由多个基本的operation结合而来

minimal Relational algebra:Ω=π,σ,⋈,β,∪,−\Omega=\pi ,\sigma,\bowtie,\beta,\cup,-

安全访问(sichere Anfragen)

所谓安全访问,就是指无论在何种数据库状态(Datenbankzustand)下,都能得到有限个结果的访问//什么叫数据库状态,还没搞清楚????

举个反例:{x,y|¬R(x,y)x,y|\lnot R(x,y)} ; x,y∈Nx,y \in N

为什么要用Logik作为访问语言

1.认识一种新的关系数据模型的访问语言,并且他们在表达能力上存在差别

2.Datalog做为一种基于Logik的访问语言,他与Relational Algebra等存在显著的区别。他有更加严谨的语言格式,这在带来一些有点的同时,也限制了他的可扩展性。学习Datalog可以开阔我们的视野

//这都是什么Motivation啊

3.Datalog可以表达一些Relational Algebra无法表达的问题,比如递归问题(z.B Transitive Huelle)

Logik的三个基本概念

Belegung:(翻译成分配不知道对不对)给一个变量分配一个值

Interpretation:(解释)就是signatur到konstant的映射I:∑→I:\sum \to {T,F}

Modell:表达为真得Belegung

//详细的就看形式系统吧(Formal System)

例子:val(A1)=1,val(A2)=0val(A1)=1, val(A2)=0是Belegung,但不是Modell

//表达逻辑 和谓词逻辑有什么区别呢????

下面是谓词逻辑:

besuchtVorlesung(x)⇒bestehtPruefung(x)\Rightarrow bestehtPruefung(x)

从一个确定的值域里面取值给一个变量赋值

Datalog//我还是Google一下datalog再说吧

Datalog是Prolog的子集(Teilmenge von Prolog)

基本例子:

关系:Person(Name,Age,Sex) Parent(Father,Mother)

father(X,Y):-Person(X,_,m),Parent(X,Y)

其中Person和Parent属于basis DB(Extensional Datenbank:EDB),father属于intentional Datenbank(IDB,即推到出来的 view)

基本例子2:

访问:

?-Mutter(X,Annie)

Mather(X,Y):-Person(X,_w),Parent(X,Y)

根据IDB规则查表找出Annie的母亲

问题:一个表达逻辑的可实现性是很难判断的,因此设置范围是很必要的

基本概念:

Atom://这就不说了

Literal:¬\lnotAtom或Atom

Klausel:Literal的析取

Horn-Klausel:·最多含有一个正的Atom的Klausel

Datalog-Programm: 有限个Horn-Klausel的集合

Horn-Klausel的例子:

Ancestor(X,Y):-Parent(X,Y)

Ancestor(X,Y):-Parent(X,Z),Ancestor(Z,Y)

Datenbank KonzeptRelationAttributeTupleAttribute valueView访问Logik-Programm KonzeptPredicatevariableGrundklauselKonstantRegel目标
\begin {array}{c|c}
\hline
\text{Datenbank Konzept}&\text{Logik-Programm Konzept}\\
\hline
\text{Relation}&\text{Predicate}\\
\text{Attribute}&\text{variable}\\
\text{Tuple}&\text{Grundklausel}\\
\text{Attribute value}&\text{Konstant}\\
\text{View}&\text{Regel}\\
\text{访问}&\text{目标}\\
\hline
\end{array}

//倒数第三个有点不懂??

Recursion

Datalog可以实现Recursion,比如

Ancestor(X,Y):-Parent(X,Y)

Ancestor(X,Y):-Parent(X,Z),Ancestor(Z,Y)

IDB pradicate(如Ancestor)即可以在头部,也可以在躯干部分

用relational algebra则无解

**问题:**Recursion in Datalog和前面的transitiver Hülle有什么区别呢??//不知啊 好像前面transitiver Hülle 也木写的样子???一样??

Fixpunkt:即f(x)=x

运行算法:

IDB 初始为空

把regel应用于tupel上生成新的Tupel,然后循环

线性:

recursion分线性与非线性

如上述的regel即为线性的,他相应的非线性的regel为:

Ancestor(X,Y):-Parent(X,Y)

Ancestor(X,Y):-Ancestor(X,Z),Ancestor(Z,Y)

//没看出是怎么区分的???

有些系统不支持非线性的recursion

运行结束:

上述运行算法的在什么时候终结可以很明显的看出来,因为对于原始有限的n个tupel,那么他可以计算出他最多就能生成n(n+1)/2个Ancestor,因为有上限所有可以很好得识别出算法的结束

与Prolog的区别

Datalog的Regel的顺序无关紧要

Datalog不包含有非

Prolog例子:来自WikiPedia

gamble(X):-gotmeoney(X)

gamble(X):-gotcredit(X),NOT gotmeney(X)

cut-Operator:停止寻找替换,也就是说当找到一个匹配的规则后就不继续尝试其他规则

green cut:即当去掉第一个规则后,规则还是正确的

red cut:与green cut相反

prolog效率比较高,但是相对的也比较容易出现错误(fehleranfaelliger)

另外Datalog的Predicate的参数不能是复杂的计算如P(f(1),2)是不允许的

Datalog Programm的语义(Semantik)

//这节还在问人中 至今都木回复,主要不知道Modelltheoretisch和Beweistheoretisch是怎么区分的???

Monotone属性

Monotone属性即增大一个访问或Operator的input,不会导致输出的缩减。比如Diff Operator就是Monotone的,而与之相反selection就不是Monotone的

Datalog访问都有Monotone属性

Datalog的表达能力

去掉Rekursion的Datalog≡\equiv去掉diff Operator的Relational Algebra

例如:σA=C(R)⇔R1(A,B,C):−R(C,B,C)\sigma_{A=C}(R)\Leftrightarrow R1(A,B,C):-R(C,B,C)

带有非操作的recursion

在recursion 中加入非Operator可以提高表达能力,但同时也带来了一些麻烦,比如他可能导致访问的振动 比如下面的例子//好具体啊???

P(X):−R(X),¬Q(X)P(X):-R(X),\lnot Q(X)

Q(X):−R(X),¬P(X)Q(X):-R(X),\lnot P(X)

假设初始R有一个Tupel{0}, P,Q为空,那么第一轮之后P,Q都含有一个Tupel {0},但是第二轮,根据规则P,Q中得Tupel {0}则都会被删去,如此反复。

因此在regel的躯干中使用非Operator时应该经过仔细的考虑。

//Wird negatives Liberal der Form ¬P\lnot Pin Regel benutzt, muss P bis dahin vollständig berechnet sein.??? S49

分层规则(Stratifiziertes Programm):

把规则根据其可表达性进行分层://再次好具体啊???

例如:

第一层:

T(X,Y):-R(X,Y)

T(X,Y):-R(X,Z),T(Z,Y)

第二层:

C(X,Y):−T(X,Y),¬S(X,Y)C(X,Y):-T(X,Y),\lnot S(X,Y)

//是把有非操作的和没非操作的分开吗??显然没这么简单啊??

//分层有什么作用也还没搞清楚

结构图:



//这个还没经过老师的同意就上传了,算不算犯法啊

中间那个是上面规则的结构图,箭头表达了一种依赖关系,线上的“-”表示非Operator。

其中AAreaches和UAreaches为第一层规则,UAonly为第二层规则

一个正确的带有非Operator的Regel,他的结构图应该是不包含有循环的



//这是反例!!!

检测结构图是否有循环的算法思想://不是一目了然吗??

删去第二层节点,和依赖于第二层节点的节点。//还剩下有第一层的几点就说明不含有循环吧??呵呵???

SQL中得recursion

SQL-99起允许在SQL访问中使用recursion

Datalog Programm:

Reaches(x,y):-Flights(a,x,y,d,r)

Reaches(x,y):-Reaches(x,z),Reaches(z,y)

SQL-99:

WITH RECURSIVE Reaches(from,to)AS

(SELECT arm,to FROM Flights)

UNION

(SELECT R1.arm,R2.to

FROM Reaches R1, Reaches R2

WHERE R1.to=R2.frm)

SELECT * FROM Reaches;

//其实这些语法不大懂,还得补习??

//另外还有Mutual Recursion也是不懂??S57
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: