ElasticSearch51:索引管理_内核级知识点_深入探秘type底层数据结构
2018-01-08 17:32
429 查看
1.每个index对应的type底层结构是怎样的?
type,是一个index中用来区分类似的数据的数据结构,但是可能有不同的field,而且有不同的属性来控制索引建立、分词器
field的value,在底层的lucense中建立索引的时候,全部是opaque bytes类型,不区分类型。
lucense是没有type的概念,在document中,实际上是将type作为一个document的field来存储,即_type。
es通过_type来进行type的过滤和筛选
一个index中的多个type,实际上是放在一起存储的,因此一个index下,不能有多个type重名,而类型或者其他设置不同的,因为那样是无法处理的。
例子:我们创建一个index,并加入两个type
其实,index的type底层结构是这样的
ecommerce
{
"mappings":{
"_type":{
"type:"string",
"index":"not_analyzed"
}
},
"name":{
"type":"string"
},
"price":{
"type":"double"
},
"service_period":{
"type":"string"
},
"eat_period":{
"type":"string"
}
}
如果我们加入两条数据
{
"name":"geli kongtiao",
"price":1999,
"service_period":"one year"
}
{
"name":"aozhou dalongxia",
"price":999,
"eat_period":"one week"
}
那么其实底层存储的是这样的两条数据,会将其他的字段也加入,每个document包含该index中所有的type的field
{
"name":"geli kongtiao",
"price":1999,
"eat_period":"",
"service_period":"one year"
}
{
"name":"aozhou dalongxia",
"price":999,
"eat_period":"one week",
"service_period":"one year"
}
2.最佳实践
将类似的结构的type放在一个index下,这些type应该有多个field是相同的
加入说,你将两个field完全不同的type放到同一个index下,那么每条数据都至少有一半的field在底层的lucense中时空值,会有严重的性能问题
type,是一个index中用来区分类似的数据的数据结构,但是可能有不同的field,而且有不同的属性来控制索引建立、分词器
field的value,在底层的lucense中建立索引的时候,全部是opaque bytes类型,不区分类型。
lucense是没有type的概念,在document中,实际上是将type作为一个document的field来存储,即_type。
es通过_type来进行type的过滤和筛选
一个index中的多个type,实际上是放在一起存储的,因此一个index下,不能有多个type重名,而类型或者其他设置不同的,因为那样是无法处理的。
例子:我们创建一个index,并加入两个type
{ "ecommerce":{ "mappings":{ "electronic_goods":{ "properties":{ "name":{ "type":"string" }, "price":{ "type":"double" }, "service_period":{ "type":"string" } } }, "fresh_goods":{ "properties":{ "name":{ "type":"string" }, "price":{ "type":"double" }, "eat_period":{ "type":"string" } } } } } }
其实,index的type底层结构是这样的
ecommerce
{
"mappings":{
"_type":{
"type:"string",
"index":"not_analyzed"
}
},
"name":{
"type":"string"
},
"price":{
"type":"double"
},
"service_period":{
"type":"string"
},
"eat_period":{
"type":"string"
}
}
如果我们加入两条数据
{
"name":"geli kongtiao",
"price":1999,
"service_period":"one year"
}
{
"name":"aozhou dalongxia",
"price":999,
"eat_period":"one week"
}
那么其实底层存储的是这样的两条数据,会将其他的字段也加入,每个document包含该index中所有的type的field
{
"name":"geli kongtiao",
"price":1999,
"eat_period":"",
"service_period":"one year"
}
{
"name":"aozhou dalongxia",
"price":999,
"eat_period":"one week",
"service_period":"one year"
}
2.最佳实践
将类似的结构的type放在一个index下,这些type应该有多个field是相同的
加入说,你将两个field完全不同的type放到同一个index下,那么每条数据都至少有一半的field在底层的lucense中时空值,会有严重的性能问题
相关文章推荐
- elasticsearch核心知识---48.内核级知识点:深入type底层数据结构
- 深入理解Redis:底层数据结构
- 深入理解Redis:底层数据结构
- 再读uclinux-2008r1(bf561)内核存储区域管理(1):相关数据结构
- redis数据对象底层结构图
- 数据结构(严蔚敏)图论章节知识点汇总
- 深入云存储系统Swift核心组件:Ring数据结构及构建、重平衡操作
- 数据结构中树的知识点
- 数据结构课程设计-图书管理系统
- 利用通用权限管理系统底层解决数据从不同库的导入导出问题
- 数据结构课程设计之通讯录管理系统
- 数据结构一:企业级顺序存储底层库封装
- 数据结构课程设计--学生成绩管理
- 使用 MySQL 管理层次结构的数据
- HashMap的实现原理和底层数据结构
- 【数据结构之二叉树】(二)B+树比B树更适合做文件索引的原因
- Redis 一、数据结构与对象--五大数据类型的底层结构实现
- 基于LDAP的用户管理数据结构
- 深入“大数据”管理
- [developerWorks] 深入解析DB2-高级管理、内部体系结构与诊断案例(6)