上下文无关文法
2014-11-17 16:19
239 查看
在计算机科学中,若一个形式文法 G = (N, Σ, P, S) 的产生式规则都取如下的形式:V -> w,则称之为上下文无关文法(英语:context-free grammar,缩写为CFG),其中 V∈N ,w∈(N∪Σ)* 。上下文无关文法取名为“上下文无关”的原因就是因为字符 V 总可以被字串 w 自由替换,而无需考虑字符 V 出现的上下文。一个形式语言是上下文无关的,如果它是由上下文无关文法生成的(条目上下文无关语言)。
上下文无关文法重要的原因在于它们拥有足够强的表达力来表示大多数程序设计语言的语法;实际上,几乎所有程序设计语言都是通过上下文无关文法来定义的。另一方面,上下文无关文法又足够简单,使得我们可以构造有效的分析算法来检验一个给定字串是否是由某个上下文无关文法产生的。例子可以参见 LR 分析器和 LL 分析器。
BNF(巴克斯-诺尔范式)经常用来表达上下文无关文法。
![](http://upload.wikimedia.org/math/0/3/e/03e4fe76af9f8edf051d6a7b3e2d9a1c.png)
这里的
1.
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
是“非终结”符号或变量的有限集合。它们表示在句子中不同类型的短语或子句。
2.
![](http://upload.wikimedia.org/math/c/b/4/cb4efae84f23aaf41fa73a2bf19e9068.png)
是“终结符”的有限集合,无交集于
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
,它们构成了句子的实际内容。
3.
![](http://upload.wikimedia.org/math/e/f/2/ef2463c540aa8ecc181a9c1d9ddf0982.png)
是开始变量,用来表示整个句子(或程序)。它必须是
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
的元素。
4.
![](http://upload.wikimedia.org/math/1/5/3/153fc2a5a0a49d52dda62d96ae0a293f.png)
是从
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
到
![](http://upload.wikimedia.org/math/6/9/5/695f21c444e80c48943165fb0bd71ca5.png)
的关系,使得
![](http://upload.wikimedia.org/math/f/7/1/f71a9789df05189e2449af8848e15c90.png)
。
此外,
![](http://upload.wikimedia.org/math/1/5/3/153fc2a5a0a49d52dda62d96ae0a293f.png)
是有限集合。
![](http://upload.wikimedia.org/math/1/5/3/153fc2a5a0a49d52dda62d96ae0a293f.png)
的成员叫做文法的“规则”或“产生式”。星号表示Kleene星号运算。
补充定义 1
对于任何字符串
![](http://upload.wikimedia.org/math/7/8/3/783a78704386483e48913d867c36dd47.png)
,我们称
![](http://upload.wikimedia.org/math/6/1/e/61efad693efe8e0ffd7d7bc042b427ef.png)
生成
![](http://upload.wikimedia.org/math/2/d/3/2d3fdc651d296cf7a5bde9d58fa58c47.png)
,写为
![](http://upload.wikimedia.org/math/3/d/3/3d37433f335f66b0aeaf6e68b081fc8a.png)
,如果
![](http://upload.wikimedia.org/math/3/b/3/3b3704a2e38d018377947b2ad2c87be9.png)
使得
![](http://upload.wikimedia.org/math/7/d/a/7dabacb2ed5f1e692dfdab781d5943ae.png)
且
![](http://upload.wikimedia.org/math/1/c/8/1c8494c7438999920d93b7c113649fe3.png)
。因此
![](http://upload.wikimedia.org/math/9/e/3/9e3669d19b675bd57058fd4664205d2a.png)
是应用规则
![](http://upload.wikimedia.org/math/3/b/6/3b6d98956c5592951ef450ca15cc1c28.png)
于
![](http://upload.wikimedia.org/math/7/b/7/7b774effe4a349c6dd82ad4f4f21d34c.png)
的结果。
补充定义 2
对于任何
![](http://upload.wikimedia.org/math/a/4/3/a4355f1ca34543a234857e41b56a8e3e.png)
(或
![](http://upload.wikimedia.org/math/a/e/0/ae0d032b9ac27add6078841ea8e952f8.png)
在某些教科书中),如果
![](http://upload.wikimedia.org/math/c/4/f/c4f47d348edb58bec99f890511d47c0b.png)
使得
![](http://upload.wikimedia.org/math/8/b/1/8b14003fe2d524185312368c89edf39e.png)
。
补充定义 3
文法
![](http://upload.wikimedia.org/math/0/3/e/03e4fe76af9f8edf051d6a7b3e2d9a1c.png)
的语言是集合
![](http://upload.wikimedia.org/math/2/b/3/2b36fd7b9ed49a6ac3d694c5ed146fbb.png)
补充定义 4
语言
![](http://upload.wikimedia.org/math/4/3/a/43afc2e242876990f6bf778f2a2278d7.png)
被称为是上下文无关语言(CFL),如果存在一个 CFG
![](http://upload.wikimedia.org/math/3/e/0/3e00f9a1e18c7251df05848cdc0b416b.png)
使得
![](http://upload.wikimedia.org/math/7/e/2/7e2da3c2806283544273ad82bab60681.png)
。
由于 Chomsky 范式在形式上非常简单,所以它在理论和实践上都有应用。比如,对每一个上下文无关语言,我们可以利用 Chomsky 范式构造一个多项式算法,用它来判断一个给定字串是否属于这个语言(CYK算法)。
上下文无关文法重要的原因在于它们拥有足够强的表达力来表示大多数程序设计语言的语法;实际上,几乎所有程序设计语言都是通过上下文无关文法来定义的。另一方面,上下文无关文法又足够简单,使得我们可以构造有效的分析算法来检验一个给定字串是否是由某个上下文无关文法产生的。例子可以参见 LR 分析器和 LL 分析器。
BNF(巴克斯-诺尔范式)经常用来表达上下文无关文法。
形式定义
上下文无关文法 G 是 4-元组:![](http://upload.wikimedia.org/math/0/3/e/03e4fe76af9f8edf051d6a7b3e2d9a1c.png)
这里的
1.
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
是“非终结”符号或变量的有限集合。它们表示在句子中不同类型的短语或子句。
2.
![](http://upload.wikimedia.org/math/c/b/4/cb4efae84f23aaf41fa73a2bf19e9068.png)
是“终结符”的有限集合,无交集于
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
,它们构成了句子的实际内容。
3.
![](http://upload.wikimedia.org/math/e/f/2/ef2463c540aa8ecc181a9c1d9ddf0982.png)
是开始变量,用来表示整个句子(或程序)。它必须是
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
的元素。
4.
![](http://upload.wikimedia.org/math/1/5/3/153fc2a5a0a49d52dda62d96ae0a293f.png)
是从
![](http://upload.wikimedia.org/math/c/3/f/c3f97a4420c67227501e8aa037c1c616.png)
到
![](http://upload.wikimedia.org/math/6/9/5/695f21c444e80c48943165fb0bd71ca5.png)
的关系,使得
![](http://upload.wikimedia.org/math/f/7/1/f71a9789df05189e2449af8848e15c90.png)
。
此外,
![](http://upload.wikimedia.org/math/1/5/3/153fc2a5a0a49d52dda62d96ae0a293f.png)
是有限集合。
![](http://upload.wikimedia.org/math/1/5/3/153fc2a5a0a49d52dda62d96ae0a293f.png)
的成员叫做文法的“规则”或“产生式”。星号表示Kleene星号运算。
补充定义 1
对于任何字符串
![](http://upload.wikimedia.org/math/7/8/3/783a78704386483e48913d867c36dd47.png)
,我们称
![](http://upload.wikimedia.org/math/6/1/e/61efad693efe8e0ffd7d7bc042b427ef.png)
生成
![](http://upload.wikimedia.org/math/2/d/3/2d3fdc651d296cf7a5bde9d58fa58c47.png)
,写为
![](http://upload.wikimedia.org/math/3/d/3/3d37433f335f66b0aeaf6e68b081fc8a.png)
,如果
![](http://upload.wikimedia.org/math/3/b/3/3b3704a2e38d018377947b2ad2c87be9.png)
使得
![](http://upload.wikimedia.org/math/7/d/a/7dabacb2ed5f1e692dfdab781d5943ae.png)
且
![](http://upload.wikimedia.org/math/1/c/8/1c8494c7438999920d93b7c113649fe3.png)
。因此
![](http://upload.wikimedia.org/math/9/e/3/9e3669d19b675bd57058fd4664205d2a.png)
是应用规则
![](http://upload.wikimedia.org/math/3/b/6/3b6d98956c5592951ef450ca15cc1c28.png)
于
![](http://upload.wikimedia.org/math/7/b/7/7b774effe4a349c6dd82ad4f4f21d34c.png)
的结果。
补充定义 2
对于任何
![](http://upload.wikimedia.org/math/a/4/3/a4355f1ca34543a234857e41b56a8e3e.png)
(或
![](http://upload.wikimedia.org/math/a/e/0/ae0d032b9ac27add6078841ea8e952f8.png)
在某些教科书中),如果
![](http://upload.wikimedia.org/math/c/4/f/c4f47d348edb58bec99f890511d47c0b.png)
使得
![](http://upload.wikimedia.org/math/8/b/1/8b14003fe2d524185312368c89edf39e.png)
。
补充定义 3
文法
![](http://upload.wikimedia.org/math/0/3/e/03e4fe76af9f8edf051d6a7b3e2d9a1c.png)
的语言是集合
![](http://upload.wikimedia.org/math/2/b/3/2b36fd7b9ed49a6ac3d694c5ed146fbb.png)
补充定义 4
语言
![](http://upload.wikimedia.org/math/4/3/a/43afc2e242876990f6bf778f2a2278d7.png)
被称为是上下文无关语言(CFL),如果存在一个 CFG
![](http://upload.wikimedia.org/math/3/e/0/3e00f9a1e18c7251df05848cdc0b416b.png)
使得
![](http://upload.wikimedia.org/math/7/e/2/7e2da3c2806283544273ad82bab60681.png)
。
范式
每一个不生成空串的上下文无关文法都可以转化为等价的 Chomsky 范式或 Greibach 范式。这里两个文法等价的含义指它们生成相同的语言。由于 Chomsky 范式在形式上非常简单,所以它在理论和实践上都有应用。比如,对每一个上下文无关语言,我们可以利用 Chomsky 范式构造一个多项式算法,用它来判断一个给定字串是否属于这个语言(CYK算法)。
相关文章推荐
- 上下文无关文法及分析
- 上下文无关文法
- 语法分析(1)---上下文无关的文法(context-free grammars)
- 上下文无关文法
- 文法系列之从上下文无关语法到转换语法
- 形式语言与自动机_笔记整理(二)_上下文无关文法与下推自动机
- 文法系列之从上下文无关语法到转换语法
- 2-型文法消除左递归算法(上下文无关文法)
- 自己动手开发编译器(六)上下文无关语言和文法
- 句法模式识别(两)-正规文法、上下文无关文法
- 上下文无关文法1
- 句法模式识别(二)-正规文法、上下文无关文法
- 从上下文无关文法(CFG)到语法分析树——LL(1)分析法
- 上下文无关文法及其分析树
- 句法模式识别(二)-正规文法、上下文无关文法
- [系列][编译原理]上下文无关文法及分析
- 自动机、正则式、正则文法和上下文无关文法
- 上下文无关文法
- 上下文无关文法(CFG)
- 【CT】三、上下文无关文法,CFG,PDA