nlp-形式语言与自动机-ch04-语料库与语言知识库
2017-03-29 10:33
337 查看
1、语料库语言学是研究什么的学问?
研究自然语言机读文本(或称电子文本)的采集、存储、标注、检索、统计等方法的一门学问,其目的是通过对客观存在的大规模真实文本中的语言事实进行定量分析,为语言学研究或自然语言处理系统开发提供支持。
2、语料库语言学研究内容:
a)语料库的建设与编纂;b)语料库的加工和管理;c)语料库的应用,包括在语言学研究(言语、词汇和语义研究等)中的应用和在自然语言处理中的应用。
3、语料库的类型:
语种:单语种和多语种语料库。
记载媒体:单媒体和多媒体语料库。
地域:国家与国际语料库。
代表性和平衡性:平衡与平行语料库。
用途:通用与专用语料库。
分布时间:共时与历时语料库。
加工程度:生语料与标注语料库。
4、平行语料的两个含义:
a)在同一种语言的语料上的平行。-目的是对不同国家的(英语)进行对比研究。
b)两种或多种语言之间的平行采样和加工。-例如用于机器翻译中的双语对齐语料。
研究自然语言机读文本(或称电子文本)的采集、存储、标注、检索、统计等方法的一门学问,其目的是通过对客观存在的大规模真实文本中的语言事实进行定量分析,为语言学研究或自然语言处理系统开发提供支持。
2、语料库语言学研究内容:
a)语料库的建设与编纂;b)语料库的加工和管理;c)语料库的应用,包括在语言学研究(言语、词汇和语义研究等)中的应用和在自然语言处理中的应用。
3、语料库的类型:
语种:单语种和多语种语料库。
记载媒体:单媒体和多媒体语料库。
地域:国家与国际语料库。
代表性和平衡性:平衡与平行语料库。
用途:通用与专用语料库。
分布时间:共时与历时语料库。
加工程度:生语料与标注语料库。
4、平行语料的两个含义:
a)在同一种语言的语料上的平行。-目的是对不同国家的(英语)进行对比研究。
b)两种或多种语言之间的平行采样和加工。-例如用于机器翻译中的双语对齐语料。
相关文章推荐
- 自然语言理解——NLP中的形式语言自动机
- nlp-形式语言与自动机-ch05-语言模型
- nlp-形式语言与自动机-ch09-词义消歧
- nlp-形式语言与自动机-ch07-自动分词、命名实体识别与词性标注
- nlp-形式语言与自动机-ch10-统计机器翻译
- nlp-形式语言与自动机-ch03
- nlp-形式语言与自动机-ch08-句法分析
- nlp-形式语言与自动机-ch06-概率图模型
- 形式语言与自动机之核心——乔姆斯基体系
- 形式语言与自动机 学习笔记(1)
- 形式语言与自动机_笔记整理(二)_上下文无关文法与下推自动机
- 形式语言与自动机理论总结
- 形式语言与自动机之语言识别机器——下推自动机
- 文法的乔姆斯基体系——形式语言与自动机理论
- 形式语言与自动机_笔记整理(五)_迁移系统
- 形式语言与自动机_笔记整理(六)_Petri网与时间自动机
- 形式语言与自动机 --- 上下文无关语言 & 下推自动机
- 形式语言与自动机之语言识别机器——有穷状态自动机
- 形式语言与自动机_笔记整理(一)_有穷自动机与正则表达式
- 形式语言与自动机中的7大算法