您的位置:首页 > 其它

nlp-形式语言与自动机-ch04-语料库与语言知识库

2017-03-29 10:33 337 查看
1、语料库语言学是研究什么的学问?

研究自然语言机读文本(或称电子文本)的采集、存储、标注、检索、统计等方法的一门学问,其目的是通过对客观存在的大规模真实文本中的语言事实进行定量分析,为语言学研究或自然语言处理系统开发提供支持。

2、语料库语言学研究内容:

a)语料库的建设与编纂;b)语料库的加工和管理;c)语料库的应用,包括在语言学研究(言语、词汇和语义研究等)中的应用和在自然语言处理中的应用。

3、语料库的类型:

语种:单语种和多语种语料库。

记载媒体:单媒体和多媒体语料库。

地域:国家与国际语料库。

代表性和平衡性:平衡与平行语料库。

用途:通用与专用语料库。

分布时间:共时与历时语料库。

加工程度:生语料与标注语料库。

4、平行语料的两个含义:

a)在同一种语言的语料上的平行。-目的是对不同国家的(英语)进行对比研究。

b)两种或多种语言之间的平行采样和加工。-例如用于机器翻译中的双语对齐语料。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  自然语言处理