解析SQL Server聚焦移除（Bookmark Lookup、RID Lookup、Key Lookup）

更新时间：2016年12月06日 15:10:41 作者：JeffckyWang

本文主要讲解索引性能优化，着重对Bookmark Lookup、RID Lookup、Key Lookup三者进行移除的实现进行解析，以此来提高查询性能。希望对大家有所帮助

前言

前面几节都是讲的基础内容，本节我们讲讲索引性能优化，当对大数据进行处理时首先想到的就是索引，一旦遇到这样的问题则手忙脚乱，各种查资料，为何平常不扎实基本功呢，我们由浅入深，简短的内容，深入的理解，而非一上来就把问题给框死，立马给出解决方案，抛出问题，再到解决问题，你GET了没有。

Bookmark Lookup、RID Lookup、Key Lookup定义

一说到这三者，如果对索引研究不深的童鞋估计是懵逼的，什么玩意，我们姑且将上面三者翻译为：标签查找、行ID查找、键查找。标签查找和键查找是一个意思，在SQL 2005之前叫Key Lookup。怎么解释，如何定义呢？首先我们不看定义，直接看下面一步一步解析，如果你实在忍不住，请看园友【永红】的见解，解释还是非常到位。我们简短的说明下此三者概念。

在查询中，我们对返回的列在查询条件上若建立了非聚集索引，此时将可能尝试使用非聚集索引查找，如果返回的列没有创建非聚集索引，此时会返回到数据页中去获取这些列的数据，即使表中存在聚集索引或者没有，都会返回到表中或者聚集索引中去获取数据。对于以上场景描述，如果表没有创建聚集索引则称为Bookmar Lookup，如果表中没有聚集索引但是存在非聚集索引我们称为RID Lookup。看到这里我们就会想法操作如此耗时，还要返回到基表中去获取数据，所以才有了我们本节来移除以上三者来提高查询性能。接下来我们一起来看看。

抛出Bookmark Lookup、RID Lookup、Key Lookup问题

我们首先创建如下表

USE TSQL2012 
GO
CREATE TABLE Sales.Orders 
(
[orderid] INT,
[shipaddress] VARCHAR(100),
[shipcity] VARCHAR(100),
[shipregion] VARCHAR(100))
GO

接着进行查询

USE TSQL2012
GO
SELECT orderid, shipaddress, shipregion
FROM Sales.Orders
WHERE shipcity = '深圳'

这个不用多讲，没添加任何索引，执行查询计划是全表扫描。接下来我们创建在orderid上创建聚集索引如下：

CREATE CLUSTERED INDEX idx_cls_orderid ON Sales.Orders(orderid)

我们再执行上述查询

此时我们创建了聚集索引，所以此时查询走聚集索引，到这里我们看到情况由全表扫描转换成了索引扫描。我们在查询时一直是带了查询条件的，而对查询条件我们未作任何操作，如果我们此时在查询条件上创建了索引，此时查询的性能又会得到一点改善。我们开始对查询条件创建一个非聚集索引。

CREATE NONCLUSTERED INDEX idx_nc_shipcity ON Sales.Orders(shipcity)

我们再接着执行查询

我们观察到对查询条件创建了非聚集索引，查询计划会使用非聚集索引查找返回结果，但是对于shipaddress, shipcity, shipregion并不是索引的一部分，此时查询引擎会返回到基表中得到这些数据再返回。这种行为就叫做Bookmark Lookup或者Key Lookup。下面我们就如本文标题一样问题出现来解决问题，移除Bookmark Lookup或者Key Lookup。我们尝试用两种不同的方法来解决。

解决Bookmark Lookup、RID Lookup、Key Lookup问题

创建非聚集索引覆盖索引

我们对查询条件以及检索列创建非聚集索引。

CREATE NONCLUSTERED INDEX idx_all_cover ON Sales.Orders(shipaddress,orderid,shipcity,shipregion)

此时我们对检索列创建了非聚集索引，此时将不会再到数据页中获取数据，而是从索引中直接返回，所以到这里我们算是移除了Key Lookup。但是此时触发另外一个问题，执行查询计划走的却是索引扫描，索引到底是什么呢？我们打个比方，一个索引相当于是数据库中一个本书开始的索引，我们需要快速从书中查找到我们所需要的数据，这个时候书就是我们所说的表。索引扫描意味着要读取表中的所有行，然后返回满足条件的所有数据，当执行索引扫描时，所有行上叶子节点上的所有都会被扫描，这也就意味着索引上的所有行都会被检索一遍而不是直接检索表，和表扫描对比的话，表扫描是直接读取表中数据，所以表扫描和索引扫描还是有一点点不同，而索引查找则是依赖于索引页数据来定位满足条件的所有行，索引查找仅仅只影响满足条件以及页上包含这些满足条件的行，所以说索引查找更加高效。

上述我们稍微讲解了下索引扫描和索引查找，而上述的问题是我们创建了非聚集索引，但是结果执行的查询计划是索引扫描，很是纳闷，对于刚学索引小白的我来说，不知该如何是好，以为是缓存的缘故，清除各种缓存均不好使。于是开始胡思乱想是不是检索列中数据有为NULL引起的，是不是检索列数据重复引起的，尝试了无数次，最终发现某一次居然好使。如下

CREATE NONCLUSTERED INDEX idx_cls_cover ON 
Sales.Orders(shipcity,orderid,shipaddress,shipregion)

此时若我们将查询条件进行如下修改。

USE TSQL2012
GO
SELECT orderid, shipaddress, shipregion
FROM Sales.Orders
WHERE shipaddress = '深圳' 
GO

到这里我们应该发现了，唯一的区别在于我们创建非聚集索引时的顺序和查询条件不同就会导致索引扫描和索引查找的转换，那么到底什么时候才会执行索引查找呢？我们可以进行如下一般性总结：

索引查找的一般性结论：如果条件中包含WHERE或者ON的话，查询条件必须是位于索引集合列中首位，此时索引查找将会被使用。

此时我们穿插一点内容，上述我们创建了覆盖索引，我们来比较下覆盖索引和默认情况下聚集索引查找的性能开销。

覆盖索引与默认聚集索引性能开销比较

FROM Sales.Orders WITH(INDEX([PK_Orders]))
WHERE orderid<11072
go
SELECT orderid, shipaddress, shipregion
FROM Sales.Orders WITH(INDEX([idx_noncls_include_exceptorderid]))
WHERE orderid<11072
GO

从上可知，覆盖索引的开销要比默认主键聚集索引性能开销要好一点，同时我们可以看看如下二者IO代价。

通过上述覆盖索引与默认聚集索引的对比，我们能够有效的减少IO，这一点也是非常明确的，当然下面的INCLUDE索引对比也是另外一种好的方案。

创建INCLUDE非聚集索引

USE TSQL2012
GO
CREATE NONCLUSTERED INDEX [ix_noncls_include] ON [TSQL2012].[Sales].[Orders] (
 shipcity
) INCLUDE (shipaddress, shipregion, orderid)

至此我们用两种方式来移除了Bookmark Lookup、RID Lookup、Key Lookup，通过使用索引和覆盖索引。

既然有如上两种方式，我们应该有所取舍，二者谁的性能更好呢？我们接下来比较上述二者的开销差异。

比较移除Bookmark Lookup等两种方式差异

USE TSQL2012
GO
SELECT orderid, shipaddress, shipcity, shipregion
FROM Sales.Orders WITH(INDEX(idx_all_cover))
WHERE shipcity = '深圳'
GO
SELECT orderid, shipaddress, shipcity, shipregion
FROM Sales.Orders WITH(INDEX(ix_noncls_include))
WHERE shipcity = '深圳'
GO

我们从上所知，二者开销一样，并未有什么区别，当然相信我们更倾向于的是将第二种方式作为解决方案。到这里算是基本结束了，但是还有一个小问题，我们在之前已经创建了orderid的聚集索引，后面在解决方案中我们也添加了orderid的非聚集索引，难道非得添加吗，我们去掉试试看。

CREATE NONCLUSTERED INDEX idx_noncls_cover_exceptorderid
ON Sales.Orders(shipcity,shipaddress,shipregion)
CREATE NONCLUSTERED INDEX idx_noncls_include_exceptorderid
ON Sales.Orders(shipcity) INCLUDE(shipaddress,shipregion)

去除orderid比较二者开销差异：

USE TSQL2012
GO
SELECT orderid, shipaddress, shipregion
FROM Sales.Orders WITH(INDEX([idx_noncls_cover_exceptorderid]))
WHERE shipaddress = '深圳' 
GO
SELECT orderid, shipaddress, shipregion
FROM Sales.Orders WITH(INDEX([idx_noncls_include_exceptorderid]))
WHERE shipaddress = '深圳' 
GO

由上知，非聚集索引列不需要包含创建了聚集索引的列，那么事实到底是怎样的呢？

结论：其实对于任何非聚集索引列都不需要包含创建了聚集索引的列，因为创建聚集索引的列是非聚集索引集合列的一部分，也就是说只要一个表上的列创建了聚集索引，那么非聚集索引集合列就包含了这个聚集索引。

总结

本节我们比较详细就问题的抛出到问题的解决，从而来提高查询性能，好了，到此结束，我们下节再会。简短的内容，深入的理解

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，同时也希望多多支持脚本之家！

您可能感兴趣的文章:

SQL Server中如何给表添加注释详解
这篇文章主要给大家介绍了关于SQL Server中如何给表添加注释的相关资料,在SQL Server数据库应用程序开发中,可以在数据库表结构创建时为它们添加注释,以便更好地描述其作用、含义或其他相关信息,需要的朋友可以参考下
2023-11-11
如何使用Pycharm连接SQL Sever(详细教程)
这篇文章主要介绍了如何使用Pycharm连接SQL Sever，本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-04-04
sqlserver 索引的一些总结
如果说要对数据库进行优化，我们主要可以通过以下五种方法，对数据库系统进行优化
2012-08-08
SQL直接操作excel表(查询/导入/插入)
操作excel表包括：查询Excel数据;将Excel的数据导入SQL server; 将SQL SERVER中查询到的数据导成一个Excel文件;在SQL SERVER里往Excel插入数据，感兴趣的你可以参考下哈
2013-03-03
数据库中两张表之间的数据同步增加、删除与更新实现思路
可以采用分别创建增加、删除、更新的触发器(Trigger)来达到两张表之间数据同步的目的，感兴趣的朋友可以参考下，希望可以帮助到你
2013-03-03
Blazor Server 应用程序中进行 HTTP 请求
这篇文章主要介绍了Blazor Server 应用程序中进行 HTTP 请求方法的相关资料，感兴趣的朋友一起来学习吧
2021-08-08
优化SQL Server的内存占用之执行缓存
在论坛上常见有朋友抱怨，说SQL Server太吃内存了。这里笔者根据经验简单介绍一下内存相关的调优知识
2012-04-04
SQL Server2022版+SSMS下载安装教程(保姆级)
本文主要介绍了SQL Server2022版+SSMS下载安装教程,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-10-10
SQL server数据库日志文件收缩操作方法
日常使用数据库可能存在日志每天增长10G或以上,太恐怖了!数据量过大导致服务器卡死,内存溢出,执行Sql过慢等问题,这篇文章主要给大家介绍了关于SQL server数据库日志文件收缩操作的相关资料,需要的朋友可以参考下
2024-02-02
谈谈sqlserver自定义函数与存储过程的区别
这篇文章主要介绍了谈谈sqlserver自定义函数与存储过程的区别,需要的朋友可以参考下
2014-09-09