目录
(一)前言
(二)正文
1. 物化视图(索引视图)与查询重写的基本概念
2. 创建测试环境
(1)建表
(2)写数据
3. 索引视图创建
(1)创建语法
(2)为索引视图创建索引
4. 查询重写
5. 为什么查询会被重写
6. 索引视图什么时候更新
7. 改变基于视图的查询
(一)前言
之前做ORACLE DBA的时候,在参与业务涉及中常会遇到物化视图这个概念,同样在SQL SERVER中也有类似于ORACLE的物化视图的功能,只是名称变成了索引视图。本文我们将采用SQL SERVER来谈一谈索引视图(物化视图)以及基于此的查询重写。
(二)正文
1. 物化视图(索引视图)与查询重写的基本概念
与普通视图比,物化视图就是直接将数据存储起来了。而物化视图的作用之一就是可以实现查询重写。SQL Server中的索引视图就具有查询重写的功能,所谓的查询重写,就是如果符合条件的数据在索引视图上,并且查询列都包含在在索引视图上,此时可以直接通过查询索引视图来替代基于原始表的查询。
2. 创建测试环境
(1)建表
创建两张表,一张表头TESTZYY,一张明细TESTLMN,仅仅作为DEMO使用
--创建两张表,一张表头TESTZYY,一张明细TESTLMN,仅仅作为DEMO使用
CREATE TABLE TESTZYY
(
HeadId INT PRIMARY KEY ,
HeadInfo VARCHAR(50) ,
DataStatus TINYINT ,
CreateDate Datetime
)
GO;
CREATE TABLE TESTLMN
(
HeadId INT ,
DetailId INT identity(1,1) PRIMARY KEY ,
DetailInfo VARCHAR(50)
)
GO;
(2)写数据
给上一步中创建的两个表各插入20万条数据。
--写入数据
DECLARE @i int = 0
WHILE @i<200000
BEGIN
INSERT INTO TESTZYY values (@i,NEWID(),RAND()*10,GETDATE()-RAND()*100)
INSERT INTO TESTLMN(HeadId,DetailInfo) VALUES (@i,NEWID())
SET @i=@i+1
END
GO
3. 索引视图创建
那么如何创建索引视图呢?语法上跟创建普通视图差别不大,但是不允许出现select *,表名上要加上Scheme,如下会做简单说明。
(1)创建语法
CREATE VIEW V_IndexViewTest WITH SCHEMABINDING
AS
SELECT H.HeadId,H.CreateDate,H.DataStatus,D.DetailId,D.DetailInfo
FROM dbo.TESTZYY H INNER JOIN
dbo.TESTLMN D ON H.HeadId = D.HeadId
WHERE H.DataStatus = 0
GO;
(2)为索引视图创建索引
索引视图要求创建的第一个列为唯一聚集索引,所以如下,创建一个唯一的聚集索引。
create unique clustered index idx_headid
on V_IndexViewTest(detailid);
对于其他索引,可以跟在表上创建索引一样
create index idx_createdate on V_IndexViewTest(Createdate);
4. 查询重写
上面说了,查询重写就是将基于原始表的查询语句,直接在索引视图上查询实现,那么就来看一下查询重写是什么样子的?
下面来观察这么一个查询,SQL很明显地是基于原始表做的查询,跟普通查询并无二致,但是观察执行计划就会发现:这个执行计划走了一个索引查找,首先很清楚,TESTZYY上的CreateDate是没有索引的,这里走的索引就是V_IndexViewTest上的CreatDate列上的索引,也就是在索引视图上创建的第二个索引。
select H.headid,H.createdate,D.detailid,D.detailinfo
from dbo.TESTZYY H inner join
dbo.TESTLMN D on H.headid = D.headid
where H.datastatus = 0
and H.createdate > '2022-10-01 00:00:00.000'
and H.createdate < '2022-10-02 00:00:00.000'
如果,查询语句这么写,如下,在查询条件中增加了一个索引视图中没有的列,此时查询就不会被重写,直接走的是基于原始表的查询,跟普通查询并无二致。
其实原理不难理解,因为视图中并不包含HeadInfo这个列,如果在查询列上加上这个字段,视图中是没有这个字段的,那只能基于原始表做查询了。
select H.headid,H.createdate,H.headinfo,D.detailid,D.detailinfo
from dbo.TESTZYY H inner join
dbo.TESTLMN D on H.headid = D.headid
where H.datastatus = 0
and H.createdate > '2022-10-01 00:00:00.000'
and H.createdate < '2022-10-02 00:00:00.000'
5. 为什么查询会被重写
上面我们看到了,对于合适的查询,查询是会被重写的,也就是查询直接基于索引视图来实现,那么为什么会直接基于视图来实现呢?
还是处于性能上的考虑,因为索引视图在创建唯一的聚集索引之后,视图就“固化了”原始表的结果集,此时的视图与普通视图最大的区别就是,视图中直接存储了数据本身,而非一个查询,此时的视图中的数据集,相当于基于原表的一个“子集”,因为是子集,这个结果集必然小于原始表,那么同样的查询字段和查询条件,不但可以减少表与表之间的链接操作,且结果集更小,从这个视图上查询,因此同等条件下可以更快地返回结果,所以查询重写也就不难理解了。
结合上述结论,此时只要查询字段和查询条件一样,基于原始表的查询和直接查询索引视图是一样的,如下截图 :
select H.headid,H.createdate,D.detailid,D.detailinfo
from dbo.TESTZYY H inner join
dbo.TESTLMN D on H.headid = D.headid
where H.datastatus = 0 and H.createdate > '2022-10-01 00:00:00.000'
and H.createdate < '2022-10-02 00:00:00.000';
select headid,createdate,detailid,detailinfo
from dbo.V_IndexViewTest
where datastatus = 0 and createdate > '2022-10-01 00:00:00.000'
and createdate < '2022-10-02 00:00:00.000';
6. 索引视图什么时候更新
上面说了查询重写,如果条件允许,基于原始表的查询会直接从索引视图上来实现。可能有人会不放心,毕竟数据都是基于物理表做增删改的,而索引视图中的数据又是物理存在的,那就就会有一个担心,基于视图的查询会不会不准确?毕竟是我好好的一个查询,你默认给我定位到索引视图上,查询结果会跟原始表查询一致吗?
那么就要求证一下,索引视图中的数据是如何更新的。我们做这么一个测试,在基表,也就是TESTLMN中查询一条数据,看看到底在执行计划中发生了什么 可以明显地看到,不仅仅是往TESTLMN中写入了一条数据,同时,基于索引视图的查询也往索引视图中写入了一条数据,因此可以放心地使用索引视图而不必担心索引视图中的数据和基表的数据不一致的问题。
但是要注意的就是,此时的写,是写入基表的同事,也写入了索引视图,对写入的影响是肯定有一些的,如果对写入效率要求非常高,就要谨慎一点了。其实索引视图也是一种冗余写来实现查询效率的提高的。
insert into dbo.TESTLMN(HeadId,DetailInfo) values (666,newid());
7. 改变基于视图的查询
上面说了,某些基于视图的查询,是直接定位到视图,从视图中查询结果返回的,如下图
但是如果真的不想从视图中查询,我就是想对比一下原始表和基于视图查询的(效率上的)区别,该怎么办?这个也好办,可以通过查询提示,将查询来基于原始表实现,也就是展开这个索引视图了OPTION (EXPAND VIEWS)这个查询提示就是将视图展开,从原始表进行查询,默认情况下是不展开的。如截图,可以强制展开索引视图,从原始表查询 :
select headid,createdate,detailid,detailinfo
from dbo.V_IndexViewTest
where datastatus = 0 and createdate > '2022-10-01 00:00:00.000'
and createdate < '2022-10-02 00:00:00.000' option(expand views);
那么效率对比呢?如下截图,粗看起来,这个效率差别还是挺大的,可见,SQL Server默认选择下,载效率上还是有一定的考虑的
这里从索引视图查询,一是减少了表之间的join,而是索引视图的结果集更小,从中筛选符合条件的数据效率就会更好一些。所以,默认情况下是会从视图查询来对SQL进行查询重写的。索引视图的查询提示:with(no expand) 强制不展开,OPTION (EXPAND VIEWS)强制展开。
总结:
本文粗浅地分析了SQL Server 中的索引视图以及索引视图带来的查询重写功能,通过索引视图固化基表的结果集,
可以在一定程度上提高查询效率,尤其是在超级大的多表join的时候,直接将原始结果存为一个索引视图,
通过对索引视图查询来减少表之间的join和IO来提高效率,不失为一种优化选择。
需要注意的是,SQL Server的索引视图限制非常多,具体可以参考链接丛书或者MSND,并不是所有的情况都可以使用索引视图来实现。