SQL优化之针对count、表的连接顺序、条件顺序、in及exist的优化

更新时间：2014年07月21日 16:25:52 投稿：shichen2014

这篇文章主要介绍了SQL优化之针对count、表的连接顺序、条件顺序、in及exist的优化,有助于读者深入理解Oracle的运行效率及优化策略,需要的朋友可以参考下

本文详述了SQL优化中针对count、表的连接顺序、条件顺序、in及exist的优化，非常具有实用价值！详述如下：

一、关于count

看过一些网上关于count(*)和count(列)的文章，count(列)的效率一定比count(*)高吗？

其实个人觉得count(*)和count(列)根本就没有可比性，count(*)统计的是表里面的总条数，而count(列)统计的是当列的非空记录条数。

不过我们可以通过实验来比较一下：

首先创建测试表：

drop table test purge;
create table test as select * from dba_objects;

update test set object_id =rownum ;
set timing on 
set linesize 1000
set autotrace on

执行

select count(*) from test;
select count(object_id) from test;

发现耗时是一样的，难道他们的效率其实是一样的吗？

我们在列object_id上创建索引试试看

create index idx_object_id on test(object_id);

然后再执行

select count(*) from test;
select count(object_id) from test;

发现count(object_id)的速度明显比count(*)高出一大截，难道是因为count(object_id)能用到索引，所以效率才提高了很多？

我们再修改下object_id的列属性

alter table test modify object_id not null;

然后再执行

select count(*) from test;
select count(object_id) from test;

发现其实他们的速度是一样快的，count(*)也可用到索引。
其实效率比较的前提是两个语句的写法要等价，这两种写法根本就不等价，因此不具有可比性。

对于oracle优化器来说，我们可以通过实验发现，count不同的列，统计的时间是不一样的，大致趋势是列越靠后，访问的开销越大，列的偏移量决定访问的性能。而count(*)的开销与偏移量无关。因此，在某些场合count(*)反而是最快的。

二、关于in和exist

关于in和exist的说法大都是说in的效率比exist高，所以有in的地方必需得换成exist等等。但是真的是这样的吗？

下面我们来做个试验：

在Oracle 10g中;

select * from dept where deptno NOT IN ( select deptno from emp ) ;
select * from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;

我们发现，exist确实比in的效率高啊。这个说法貌似是成立的啊。

但是我们再执行下面的语句

select * from dept where deptno NOT IN ( select deptno from emp where deptno is not null) and deptno is not null;

你会发现加上非空的约束条件后，in和exist的效率是一样的。

查看三个语句的执行计划你就会发现，没有加上非空约束的in语句和exist语句走的都是ANTI半连接算法，所以效率是一样的，而未加非空约束的in语句用的是filter，而不是ANTI算法，所以效率就差一些。

所以我们可以得出结论：在oracle 10g中，如果可以确保非空，则in约束可以用到ANTI的半连接算法，这时候的效率和exist是一样的。

在Oracle 11g中：

select * from dept where deptno NOT IN ( select deptno from emp ) ;
select * from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;

我们发现两个语句的效率是一样的，查看执行计划也是一样的。原来oracle在11g中已经做了优化，所以in和exist的效率是一样的。

由此我们可以得出结论，在11g中，使用in和exist的效率是一样的，因为他们走的都是比较高效的ANTI算法。

三、关于大小表的连接顺序

在网上我们可以看到很多这样的文章，在进行多表查询的时候，用小表或者交叉表做基础表，放在后面，大表放在from后面的位置，因为表的访问顺序是从右往左的。

但是真的是这样的吗？

我们可以做实验验证一下（此处测试环境为 Oracle 11g）：

create table tab_big as select * from dba_objects where rownum<=30000;
create table tab_small as select * from dba_objects where rownum<=10;
set autotrace traceonly
set linesize 1000
set timing on 
select count(*) from tab_big,tab_small ; 
select count(*) from tab_small,tab_big ;

我们查看执行计划可以发现，这两个语句的效率是一样的，难道多表查询，表的顺序和效率无关吗？

我们在执行下面的语句：

select /*+rule*/ count(*) from tab_big,tab_small ; 
select /*+rule*/ count(*) from tab_small,tab_big ;

我们可以清楚的发现，小表在右，大表在左的语句，查询效率高很多。

其实，在基于规则时代，查询效率是和表的连接顺序相关的，小表或者交叉表在左，大表在右的执行效率会高一些。但是现在基本上是基于代价的时代，所以大小表的顺序和效率无关，oracle优化器会自动去进行效率优化。

四、where子句中的连接条件顺序

在基于规则时代，oracle采用自下而上的顺序来解析where子句，根据这个原理，我们一般会将可能返回行数最少的表放在最后面，where子句中有过滤条件的子句放在最后面。

但是在现在基于代价时代，这种优化都有oracle优化器帮忙优化了，所以关于表的顺序和条件的顺序已经不会影响我们的查询效率了。

您可能感兴趣的文章:

SQL
优化

Oracle数字类型number自增的实现代码
这篇文章主要介绍了Oracle数字类型number自增的实现代码,需要的朋友可以参考下
2017-08-08
如何将Oracle的一个大数据表快速迁移到 Sqlserver2008数据库(图文教程)
这篇文章主要介绍了如何将Oracle的一个大数据表快速迁移到 Sqlserver2008数据库(图文教程),本文图文并茂给大家介绍的非常详细，需要的的朋友参考下吧
2017-05-05
oracle如何恢复被覆盖的存储过程
如果你不小心覆盖了之前的存储过程，那得赶紧闪回，时长越长闪回的可能性越小，下面为大家介绍下恢复原理
2014-05-05
Oracle去掉特殊字符的具体方法
这篇文章介绍了Oracle去掉特殊字符的实例代码，有需要的朋友可以参考一下
2013-10-10
关于sql脚本导入Oracle时重复生成check约束的问题解决
这篇文章主要给大家介绍了关于sql脚本导入Oracle时重复生成check约束的问题解决方法，文中给出了详细的检查步骤，对大家理解和解决这个问题具有很好的帮助，需要的朋友们下面来一起看看吧。
2017-05-05
解决Oracle安装遇到Enterprise Manager配置失败问题
这篇文章主要介绍了Oracle安装遇到Enterprise Manager配置失败问题,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-12-12
oracle表分区的概念及操作
Oracle的表分区功能通过改善可管理性、性能和可用性，从而为各式应用程序带来了极大的好处。这篇文章主要介绍了oracle表分区的概念及操作,需要的朋友可以参考下
2021-04-04
oracle分区表之hash分区表的使用及扩展
Hash分区是Oracle实现表分区的三种基本分区方式之一。对于那些无法有效划分分区范围的大表，或者出于某些特殊考虑的设计，需要使用Hash分区，下面介绍使用方法
2014-01-01
Oracle归档日志文件(查看、配置、删除)
归档日志是非活动的重做日志备份.通过使用归档日志,可以保留所有重做历史记录,本文主要介绍了Oracle归档日志文件(查看、配置、删除),具有一定的参考价值,感兴趣的可以了解一下
2023-12-12
Oracle date 和 timestamp 区别详解
这篇文章主要介绍了Oracle date 和 timestamp 区别详解的相关资料,需要的朋友可以参考下
2017-03-03

SQL优化之针对count、表的连接顺序、条件顺序、in及exist的优化

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具