您的位置:首页 > 数据库 > 其它

SQL SERVER书签查找

更多 2014/8/22 来源:数据库学习浏览量:2427
学习标签: SQL SERVER
本文导读:如果表有聚集索引(区段结构),那么书签就是从非聚集索引找到聚集索引后,利用聚集索引定位到数据。此处的书签就是聚集索引。如果表没有聚集索引(堆结构)。那么扫描非聚集索引后,通过RID定位到数据,那么此处书签就是RID。所谓的书签查找,就是通过聚集索引,然后利用聚集索引或RID定位到数据。下面介绍SQL SERVER书签查找

一、SQL SERVER书签查找定义

 

当查询优化器使用非聚集索引进行查找时,如果所选择的列或查询条件中的列只部分包含在使用的非聚集索引和聚集索引中时,就需要一个查找(lookup)来检索其他字段来满足请求。对一个有聚簇索引的表来说是一个键查找(key lookup),对一个堆表来说是一个RID查找(RID lookup),这种查找即是——书签查找(bookmark lookup)。

简单的说就是当你使用的sql查询条件和select返回的列没有完全包含在索引列中时就会发生书签查找。

 


二、SQL SERVER书签查找实例

 

1、表结构

其中 有一个 聚簇索引 PK_UserID  和一个 非聚簇索引IX_UserName。

 

2、执行如下SQL 语句

select UserName,Gender from  dbo.UserInfo where UserName='userN600' 

按上面的 SQL 产生执行计划 可以看出, 会产生一个书签查找(Key Lookup),如下图

 

 

如果把上面的 SQL 改写成
 
select UserName from  dbo.UserInfo where UserName='userN600'
 
可以看出 书签查找 没有了。
 
 
3、产生书签查找的原因
 
优化器会选择 非聚簇索引IX_UserName,来执生SQL  。IX_UserName 索引不包含 Gender 这个字段 于是产生个从索引到 数据表的 一个 查找 即 书签查找。
 
 
 
三、书签查找的缺点
 
 
1、书签查找要求访问索引页面之外的数据页面,访问两组页面增加了查询逻辑读操作次数。而且,如果页面不在内存中,书签查找可能需要在磁盘上一个随机I/O操作来从索引页面跳转到数据页面,还需要必要的CPU能力来汇集这一数据并执行必要的操作。这是因为对于大的表,索引页面和对应的数据页面通常在磁盘上并不临近。

2、如果需要增加逻辑读操作或者开销较大的物理读操作使书签查找的数据检索操作开销相当大,这个开销因素是非聚集索引更适合于返回较小的数据行数的原因。随着查询检索的行数增加,书签查找的开销将变得无法接受。

3、为了理解书签查找随着检索行数增加而使feu聚集索引无效,下面来看一个实例:

 

在Person表的ID(以1递增)上建索引,我们来看看下面两个查询的执行计划

 

(1)、返回100条

(2)、返回300条

 

我们看到,当要求返回300条数据的时候,SQL Server就不在使用Id列上的非聚集索引,而是直接进行表扫描了。因为SQL Server认为执行300次书签查找还不如直接对一张1万条记录的表进行全表扫描。

4、由上面的实例可以得出结论,返回大的结果集将增加书签查找的开销,甚至低于表扫描。因此在返回较大结果集的情况下,必须考虑避免书签查找的可能性。

 

 

四、避免书签查找的方法

 

1、使用聚集索引

对于聚集索引,索引的叶子页面和表的数据页面相同。因此,当读取聚集索引键列的值时,数据引擎可以读取其他列的值而不需要任何导航。例如前面的区间数据查询的操作,SQL Server通过B树结构进行查找是非常快速的。

把非聚集索引转换为一个聚集索引说起来很简单。但是,这个例子和大部分可能遇到的情况下,这不可能做到,因为表已经有了一个聚集索引。这个表的聚集索引恰好是主键。必须卸载掉所有的外键约束,卸载并且重建为一个非聚集索引。这不仅要考虑所涉及的工作,还可能严重地影响依赖于现有聚集索引的其他查询。

 

2、使用覆盖索引

例如

select id,name from persontenthousand where id <100

我们可以在 id,name上面建个组合索引,这样,由于非聚集索引上已经有了需要查询的Id和Name列的数据,所以不在需要书签查找定位到基本表。

 

3、使用索引连接

如果覆盖索引变得非常宽,那么可能要考虑索引连接技术。索引连接技术使用两个或更多索引之间的一个索引交叉来完全覆盖一个查询。因为索引连接技术需要访问多余一个索引,它必须在所有索引连接中使用的索引上执行逻辑读。因此,索引连接需要比覆盖索引更高的逻辑读数量。但是,因为索引连接所用的多个窄索引能够比宽的覆盖索引服务更多的查询。所以索引连接也可以作为避免书签查找的一种技术来考虑。

 

 

 

上面的例子我们创建了两个非聚集索引,一个在 Id列,一个在Name列。但是我们的查询需要同时返回Id列和Name列。而这两个非聚集索引都不完全包含要返回列。这个时候,哈希匹配目的就是通过定位到索引,而不用定位到基本表就能够获得我们所需要的全部数据,这样索引连接就避免了书签查找。

 

 

收藏
107
很赞
210