-
sql语句大全之IN和OR会走索引吗?
--注:所有步骤均按序号分步单独执行,并观察对应的情况
--0.
USE tempdb
GO
IF OBJECT_ID('t') IS NOT NULL DROP TABLE t
GO
CREATE TABLE t(pkId INT IDENTITY(1,1) PRIMARY KEY, id VARCHAR(10) NOT NULL, room VARCHAR(10) NOT NULL, otherInfo VARCHAR(100))
GO
--构建 1000 * 1000 + 2 = 1百万+2条 记录
;WITH cte AS (
SELECT sv.number FROM [master].dbo.spt_values AS sv WHERE sv.[type]='P' AND sv.number BETWEEN 1 AND 1000
)
INSERT INTO t(id,room)
SELECT LEFT(NEWID(),3),LEFT(NEWID(),4) FROM cte AS a CROSS APPLY cte AS b
UNION ALL
SELECT id ='001',room='A201'
UNION ALL
SELECT id ='002',room='A202'
GO
-------------- 以上为构建测试表及测试数据 ------------------
-------------- 以下为测试没有索引的情况 ------------------
--1.打开执行计划, 删除索引的脚本便于回过头来执行
IF EXISTS(SELECT 1 FROM sys.indexes AS i WHERE i.name='ix_t_id_room')
DROP INDEX ix_t_id_room ON t
--1.1 Clustered Index Scan (聚集索引扫描)
SET STATISTICS IO ON
SET STATISTICS TIME ON
SELECT pkId FROM t WHERE id IN ('001','002') AND room IN ('A201','A202')
/*
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
表 't'。扫描计数 1,逻辑读取 3229 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 281 毫秒,占用时间 = 299 毫秒。
*/
--1.2 Clustered Index Scan (聚集索引扫描)
SELECT pkId FROM t WHERE (id ='001' OR id='002') AND (room = 'A201' OR room = 'A202')
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
表 't'。扫描计数 1,逻辑读取 3229 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 359 毫秒,占用时间 = 352 毫秒。
*/
--1.3 Clustered Index Scan (聚集索引扫描)
SELECT pkId FROM t WHERE (id ='001' AND room = 'A201') OR (id='002' AND room = 'A202')
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
表 't'。扫描计数 1,逻辑读取 3229 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 359 毫秒,占用时间 = 346 毫秒。
*/
--1.4 Clustered Index Scan (聚集索引扫描) + Concatenation(串联)
SELECT pkId FROM t WHERE id='001' AND room='A201'
UNION ALL
SELECT pkId FROM t WHERE id='002' AND room='A202'
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
SQL Server 分析和编译时间:
CPU 时间 = 2654 毫秒,占用时间 = 2654 毫秒。
表 't'。扫描计数 2,逻辑读取 6458 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 265 毫秒,占用时间 = 257 毫秒。
*/
-------------- 以下为测试有索引的情况 ------------------
--2.创建索引
CREATE INDEX ix_t_id_room ON t(id,room)
--2.1 Index Seek (索引查找)
SELECT pkId FROM t WHERE id IN ('001','002') AND room IN ('A201','A202')
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
SQL Server 分析和编译时间:
CPU 时间 = 2 毫秒,占用时间 = 2 毫秒。
表 't'。扫描计数 4,逻辑读取 12 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
*/
--2.2 Index Seek (索引查找)
SELECT pkId FROM t WHERE (id ='001' OR id='002') AND (room = 'A201' OR room = 'A202')
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
表 't'。扫描计数 4,逻辑读取 12 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
*/
--2.3 Index Seek (索引查找)
SELECT pkId FROM t WHERE (id ='001' AND room = 'A201') OR (id='002' AND room = 'A202')
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
表 't'。扫描计数 2,逻辑读取 6 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
*/
--2.4 Index Seek (索引查找) + Concatenation(串联)
SELECT pkId FROM t WHERE id='001' AND room='A201'
UNION ALL
SELECT pkId FROM t WHERE id='002' AND room='A202'
/*
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
表 't'。扫描计数 2,逻辑读取 6 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
*/
/*******************************************
**************** 结论 *******************
1. id IN ('001','002') AND room IN ('A201','A202')
或 (id ='001' OR id='002') AND (room = 'A201' OR room = 'A202')
不符合逻辑,因为产生了4种可能,只是用来测试一下执行计划及效率;
2. IN 和 OR 不一定就不走索引,很多情况下SQL Server还是会自动优化的;
个人的优化经验1:子查询中 IN 数量不要超过外表总数量的千分之2;
个人的优化经验2:较复杂的查询, OR 尽量用 UNION ALL 来代替。
3. 最重要的一点:数据库优化没有一定之规,不能看了某篇文章就指望着靠那些理论一劳永逸打天下。
勤动手,多测试,看执行计划和IO、CPU时间消耗是不二法门。
*******************************************/
--下面是对于 IN 在数据量多大时走索引的测试
/*
总数据量:100万+2, 临界点:万分之23.53
子查询在 TOP<=2353 ,外查询走 Clustered Index Seek
子查询在 TOP> 2353 ,外查询走 Clustered Index Scan
*/
SELECT * FROM t WHERE t.pkId IN (
SELECT TOP 2353 pkId FROM t
)
--清空原表, 插入10万条数据
TRUNCATE TABLE t
;WITH cte AS (
SELECT sv.number FROM [master].dbo.spt_values AS sv WHERE sv.[type]='P' AND sv.number BETWEEN 1 AND 1000
)
INSERT INTO t(id,room)
SELECT LEFT(NEWID(),3),LEFT(NEWID(),4) FROM cte AS a CROSS APPLY (SELECT TOP 100 * FROM cte) AS b
/*
总数据量:10万, 临界点:万分之24
子查询在 TOP<=240 ,外查询走 Clustered Index Seek
子查询在 TOP> 240 ,外查询走 Clustered Index Scan
*/
SELECT * FROM t WHERE t.pkId IN (
SELECT TOP 241 pkId FROM t
)
---------------------
作者:吉普赛的歌
来源:CSDN
原文:https://blog.csdn.net/yenange/article/details/79665328
版权声明:本文为博主原创文章,转载请附上博文链接!
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式