数据库的索引_稠密索引和稀疏索引的区别-程序员宅基地

(一)顺序索引

1. 聚集索引(主索引)和非聚集索引(辅助索引)

(1)聚集索引:包含记录的文件按照某个搜索码的顺序排序。

(2)非聚集索引:搜索码制定的顺序与文件中记录的物理顺序不同(搜索码不是候选码)。

 

2. 稠密索引和稀疏索引

(1)稠密索引:文件中的每个搜索码值都有一个索引项。在稠密聚集索引中,索引项包括搜索码值以及指向具有该搜索码值的第一条数据记录的指针;在稠密非聚集索引中,索引必须存储指向所有具有相同搜索码值的指针列表。

(2)稀疏索引:只为搜索码的某些值建立索引项。只有索引是聚集索引时才能使用稀疏索引。

 

3. 多级索引:在原始的内层索引上构造一个稀疏的外层索引。

 

4. 静态索引的更新

 

(二)散列索引

1. 静态散列:将散列函数作用于搜索码以确定对应的桶,然后将此搜索码以及相应指针存入到此桶(或溢出桶)中。

 

2. 动态散列(可扩充散列)

(1)可扩充散列是在把记录插入文件时按需建桶的,可以通过桶的分裂或合并来适应数据库大小的变化。开始时,我们不使用散列值的全部b位,任意时刻我们使用的位数i满足0\leq i\leq b。这样的i个位用作附加的桶地址表中的偏移量。i的值随着数据库大小的变化而增大或减小。此外,我们给每一个桶附加一个整数值i_j,用来表示第j个桶的散列前缀长度。

 

(2)动态索引的查询和更新

(a)查询:系统先取得h(K_l)的前i个高位,然后为这个位串查找对应的表项,再根据表项中的指针得到桶的位置。

(b)插入:如果该桶有剩余空间,系统将该记录直接插入该桶;否则,如果桶j已满,系统必须分裂这个桶,并将该i=i_j桶中已有的记录和新纪录一起进行重新分配。

首先,如果i=i_j,那么在桶地址表只有一个表项指向该桶,所以系统需要增加桶地址表的大小(i=i+1);如果i> i_j,那么在桶地址表有多个表项指向该桶,系统则不需要扩大桶地址表,就能直接分裂。

分裂时加入新桶k,并且令i_k=i_j=i_j+1,根据散列值的前i_j(即i_k)位重新分配已有记录。

系统现在再次尝试插入该新纪录,通常这一尝试会成功。但是,如果桶j中原有的所有记录和新纪录都具有相同的散列值前缀,该桶就必须再次分裂。如果桶j中所有记录具有相同的搜索码,那么多少次分裂也不能解决问题。在这种情况下,就需要采用溢出桶来存储记录。

(c)删除:相当于插入的逆过程,系统不仅要把搜索码从桶中删除,还要把记录从桶中删除。如果这时桶成为空的,那么桶也需要删除。与桶的合并不同,若桶地址表很大,则改变该表的大小是一个开销很大的操作。因此只有桶数目减少很多时,减小桶地址表的大小才是必要的。

 

(三)对比总结

(1)利用稠密索引通常可以比稀疏索引更快地定位一条记录。但是,稀疏索引也有比稠密索引优越的地方:它所占空间较小,并且插人和删除时所需的维护开销也较小。

(2) 按聚集索引顺序对文件进行顺序扫描是非常有效的,因为文件中记录的物理存储顺序和索引顺序一致。但是,我们不能(除了极少数特殊情况外)使存储文件的物理顺序既和聚集索引的搜索码顺序相同,又和辅助索引的搜索码顺序相同。由于辅助码的顺序和物理码的顺序不同,因此如果我们想要按辅助码的顺序对文件进行顺序扫描,那么每读一条记录都很可能需要从磁盘读入一个新的块,这是很慢的。辅助索引能够提高使用聚集索引搜索码以外的码的查询性能。但是,辅助索引显著增加了数据库更新的开销。

(3)顺序文件组织的一个缺点是我们必须访问索引结构来定位数据,或者必须使用二分法搜索,这将导致过多的I/O操作。基于散列(hashing)技术的文件组织使我们能够避免访问索引结构。散列函数的设计需要认真仔细。一个糟糕的散列函数可能导致查找所花费的时间与文件中搜索码数目成正比;一个设计良好的散列函数一般情况下查找所花费时间是一个(较小的)常数,而与文件中搜索码的个数无关。

(4)可扩充散列最主要的优点是其性能不随文件的增长而降低。此外,其空间开销是最小的。尽管桶地址表带来了额外的开销,但该表为当前前缀长度的每个散列值存放一个指针,因此该表较小。可扩充散列与其他散列形式相比,主要的空间节省是不必为将来的增长保留桶;桶的分配是动态的。可扩充散列的一个缺点在于查找涉及一个附加的间接层,因为系统在访问桶本身之前必须先访问桶地址表。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gosick_geass_gate/article/details/85876668

智能推荐

webQQ协议java的实现方法-程序员宅基地

文章浏览阅读113次。 转载自:http://www.javadt.com/article-131-1.html webQQ协议java的实现方法2012-4-12 10:42| 发布者: 低调| 查看: 4| 评论: 9|原作者: dt|编辑 |删除摘要: 迷你版QQ实现,采用WEBQQ协议,具备登陆,获取qq好友列表,收发消息功能。 只做学习之用,无任何价值,有兴趣的童鞋拿出修改..._qq协议实现

轻松应对调试Profinet转Modbus网关出现的问题-程序员宅基地

文章浏览阅读273次,点赞4次,收藏4次。Profinet转Modbus网关(XD-MDPN100)如同Modbus设备和Profinet设备的桥梁,Profinet转Modbus网关(XD-MDPN100)可以实现Modbus设备和Profinet设备的数据双向转换和传输,是两种不同通信协议之间的桥梁,在进行Profinet转Modbus网关调试时可能会遇到一些常见问题。

项目开发中的一些注意事项以及技巧总结-程序员宅基地

文章浏览阅读128次。1、jquery采用ajax向后端请求时,MVC框架并不能返回View的数据,也就是一般我们使用View()、PartialView()等,只能返回json以及content等,但是一般我们在开发的时候也是使用json返回的,此时如果需要渲染界面或者是加载局部视图,我们可以在ajax的success的事件中使用$.html()来渲染后台给前端传的View()数据。一开始我遇到这个问题的时候还很纳闷..._开发功能时的一些技巧

Exception in thread "main" org.hibernate.HibernateException: 'hibernate.dialect' must be set when no_exception in thread "pool-2-thread-1" org.hibernat-程序员宅基地

文章浏览阅读672次。使用hibernate时出现错误:Exception in thread "main" org.hibernate.HibernateException: 'hibernate.dialect' must be set when no Connection avalable解决方式: Configuration cfg = new Configuration() 一般要改为 Config_exception in thread "pool-2-thread-1" org.hibernate.hibernateexception: no s

JDK1.8、1.9API开发文档下载_jdk8api文档下载-程序员宅基地

文章浏览阅读443次。jdk1.9、1.8开发文档下载_jdk8api文档下载

利用ArrayBlockingQueue实现生产者-消费者_arrayblockingqueue实现生成消费-程序员宅基地

文章浏览阅读1.3k次。生产者:import java.util.concurrent.BlockingQueue;public class Producer implements Runnable { private BlockingQueue queue; public Producer(BlockingQueue q){ this.queue=q; } @_arrayblockingqueue实现生成消费

随便推点

彻底卸载VS2015的工具及使用方法,亲测有效!!!_vs2015卸载工具-程序员宅基地

文章浏览阅读8.7k次,点赞4次,收藏40次。一、手动卸载VS2015主体。 打开控制面板-程序-程序功能,找到VS2015,右键更改,然后卸载,等待卸载完成。二、下载TotalUninstaller工具。链接:https://pan.baidu.com/s/1nd2RV-t29gG-hBWAJO0cvA提取码:bjul三、解压下载的文件并以管理员身份运行Setup.ForcedUninstall.exe四、在弹出的命令行窗口中输入“Y”,然后回车,等待卸载完成。提示:可以重复几次这个操作,..._vs2015卸载工具

一步一步理解大模型:模型量化技术1-简介_大模型量化等级是什么意思-程序员宅基地

文章浏览阅读3k次,点赞7次,收藏12次。简单的说,激活的意思就是如果这个靠近的某个落脚点,就把它算成某个落脚点的值. 在训练模型的时候,机器会调整这些权重,这些权重会用某个落脚点的值来表示。总的来看,模型量化的精度损失取决于多种因素,包括所使用的量化策略、模型的特性,以及实际应用中的需求等。现在,我们把这个0到1之间的范围称为一个权重,看成一片连续的水面,上面表中的值看成一个一个的“落脚点”。依此类推,你有2的n次方种方法来表示这个范围,这里的n就是比特的位数。就是说,你仅用少量的精度损失的代价节省了大量的存储空间,是非常划算的。_大模型量化等级是什么意思

IJKPLAYER源码分析-Android端显示-程序员宅基地

文章浏览阅读88次。上文分析了OpenGL ES渲染的实现。本文边可以分析video画面是如何在Android端窗口上显示的了。

数学建模(七)-----预测类-------time series_时间序列 赛马问题-程序员宅基地

文章浏览阅读1k次。构成要素:长期趋势,季节变动,循环变动,不规则变动长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型️ https://ww..._时间序列 赛马问题

OJDBC版本【classes12.jar,ojdbc14.jar,ojdbc5.jar和ojdbc6.jar的区别】_class12.jar和ojdbc.jar-程序员宅基地

文章浏览阅读883次。classes12.jar,ojdbc14.jar,ojdbc5.jar和ojdbc6.jar的区别,之间的差异在使用Oracle JDBC驱动时,有些问题你是不是通过替换不同版本的Oracle JDBC驱动来解决的?最常使用的ojdbc14.jar有多个版本,classes12.jar有多个版本你了解吗? 连接类型:1、JDBC OCI: oci是oracle call int_class12.jar和ojdbc.jar

MFC编译程序,缺少MFC动态链接库的解决-程序员宅基地

文章浏览阅读189次。MFC编译程序,缺少MFC动态链接库的解决问题:VS2010 c++编写的程序在别人的机子运行不了,缺少mfc100u.dll xxx100d.dll等的解决方法解决方法: 1.将这些dll打包,和应用程序一起发布; 2.采用MFC静态编译;附1:VS2010中静态编译设置方法使用VS2010编译的程序在windows xp中运行时 经常会出现找不到 相关的DLL文..._mfc 去除dll mfc动态库