位图索引介绍
2013-10-09 20:54
204 查看
位图索引是指使用计算机的最小单位bit来存储列值,并使用它自动生成rowid的一种索引结构。直接将列值转换为位存储不仅在很大程度上节约了存储空间,而且通过各种位运算还可以解决现有索引不能解决的很多问题。
尽管它有很多其他索引无法比拟的优点,但同时也有很多难以克服的缺陷,致使它很难被灵活运用到所有的领域。位图索引主要被使用在数据仓库(DATA Warehouse)中。尽管创建和维护位图索引需要付出代价,但使用它来查询数据可以获得非常好的效果。尤其是在处理海量数据方面,如果能够依据不同情况而正确和合理地使用,必将受益匪浅。
如果能够依据不同背景、结构、特征、以及使用它读取数据的各种方法予以详细说明,尤其是关于各种读取类型的详细执行计划将是我们介绍的重点。
位图索引的根块和分支块结构与B-TREE索引完全相同,唯独叶块与B-TREE索引有所不同。假设表中的”color”列值在每一个数据块中的存储顺序为”YELLOW,GREEN,RED,NULL”,如果基于这个列来创建位图索引,则需要将叶块中该列的各个值转化为位。利用二维表来实现位图的转化,即表的行表示各个列值所对应的位,表的列表示各个行所对应的列值。
不仅如此,在执行数据查询时,由于它能够直接将满足所有查询条件的最终转化为ROWID,所以它不像B-TREE索引那样每个索引行都有一个rowid。尽管位图索引有其他索引无法比拟的优势,但它也不是万能的,只有基于离散程度较低且相同值反复出现的列创建位图索引时,才能在很大程度上节约存储空间,例如,为具有1000万行数据的表创建位图索引可以确保其所占用的空间不超过10MB。
在基于离散度较差的列创建索引时,B-TREE索引为了提高索引的效率而需要将多个列结合在一起创建组合索引,而位图索引则不然。其之所以不用这么做主要是因为它支持集合运算,即从各个单独的位图索引中读取最终结果之后,再对其进行集合运算就可以获得与组合索引完全相同的效果。
在位的或运算中,1不论与0还是与1进行运算,结果都是1,只有当两者都是0的结果才为0;而在与运算中,0不论是与1还是与0进行运算,结果都是0,只有当两者都是1时结果才为1
。由于位运算结果其实也就查询条件的合并,所以如果查找到了位运算的结果,也就意味着查找到了满足条件的数据行。由于位图索引支持位运算,所以就使得原来复杂的”OR”运算变得容易很多。位图索引占用空间过小,所以当然扫描的速度也会提升很多。
利用位图索引从表中读取数据时,首先分别读取满足单个查询条件的所有位,然后对其进行AND运算,最后筛选出满足条件的数据。”010010”就是运算后的最终位,然后将其转化为rowid,最后使用该ROWID从表中读取对应的数据行。
尽管它有很多其他索引无法比拟的优点,但同时也有很多难以克服的缺陷,致使它很难被灵活运用到所有的领域。位图索引主要被使用在数据仓库(DATA Warehouse)中。尽管创建和维护位图索引需要付出代价,但使用它来查询数据可以获得非常好的效果。尤其是在处理海量数据方面,如果能够依据不同情况而正确和合理地使用,必将受益匪浅。
如果能够依据不同背景、结构、特征、以及使用它读取数据的各种方法予以详细说明,尤其是关于各种读取类型的详细执行计划将是我们介绍的重点。
位图索引的根块和分支块结构与B-TREE索引完全相同,唯独叶块与B-TREE索引有所不同。假设表中的”color”列值在每一个数据块中的存储顺序为”YELLOW,GREEN,RED,NULL”,如果基于这个列来创建位图索引,则需要将叶块中该列的各个值转化为位。利用二维表来实现位图的转化,即表的行表示各个列值所对应的位,表的列表示各个行所对应的列值。
不仅如此,在执行数据查询时,由于它能够直接将满足所有查询条件的最终转化为ROWID,所以它不像B-TREE索引那样每个索引行都有一个rowid。尽管位图索引有其他索引无法比拟的优势,但它也不是万能的,只有基于离散程度较低且相同值反复出现的列创建位图索引时,才能在很大程度上节约存储空间,例如,为具有1000万行数据的表创建位图索引可以确保其所占用的空间不超过10MB。
在基于离散度较差的列创建索引时,B-TREE索引为了提高索引的效率而需要将多个列结合在一起创建组合索引,而位图索引则不然。其之所以不用这么做主要是因为它支持集合运算,即从各个单独的位图索引中读取最终结果之后,再对其进行集合运算就可以获得与组合索引完全相同的效果。
在位的或运算中,1不论与0还是与1进行运算,结果都是1,只有当两者都是0的结果才为0;而在与运算中,0不论是与1还是与0进行运算,结果都是0,只有当两者都是1时结果才为1
。由于位运算结果其实也就查询条件的合并,所以如果查找到了位运算的结果,也就意味着查找到了满足条件的数据行。由于位图索引支持位运算,所以就使得原来复杂的”OR”运算变得容易很多。位图索引占用空间过小,所以当然扫描的速度也会提升很多。
利用位图索引从表中读取数据时,首先分别读取满足单个查询条件的所有位,然后对其进行AND运算,最后筛选出满足条件的数据。”010010”就是运算后的最终位,然后将其转化为rowid,最后使用该ROWID从表中读取对应的数据行。
相关文章推荐
- 论文学习 数码相机系统
- 网上音乐光碟商城
- Linux文件系统的进化
- 基于用户使用场景的产品测试
- 关于申请个人域名和虚拟主机---虚拟主机篇
- 06 体感游戏设计
- 全文索引-lucene,solr,nutch,hadoop之lucene
- 兼职议会
- 将数组中所有小于或等于0的元素都放在数组前面,大于0的元素放在数组后面
- 爱就是一个人一辈子
- C/C++中Static的作用详述
- [LeetCode]Remove Duplicates from Sorted List解题报告
- keepalived+nginx(反向代理)实现web高可用
- 求和问题总结(leetcode 2Sum, 3Sum, 4Sum, K Sum)
- 杭电 小希的迷宫 (并查集)
- iOS之文件处理
- JAVA反射机制
- 高级IO复用应用:聊天室程序
- C语言趣味编程--同时显示正弦曲线和余弦曲线
- python字符串使用方法总结