关于join on和where执行顺序分析

 更新时间:2023年03月06日 10:53:39   作者:波波仔86  
这篇文章主要介绍了join on和where执行顺序,如果是inner join, 放on和放where产生的结果一样, 执行计划也是一样,但推荐使用on,本文对join on和where执行顺序给大家详细讲解,需要的朋友可以参考下

join on和where执行顺序

1、join中相比where优先推荐on

WHERE子句中使用的连接语句,在数据库语言中,被称为隐性连接。INNER JOIN……ON子句产生的连接称为显性连接。(其他JOIN参数也是显性连接)WHERE和INNER JOIN产生的连接关系,没有本质区别,结果也一样。但是!隐性连接随着数据库语言的规范和发展,已经逐渐被淘汰,比较新的数据库语言基本上已经抛弃了隐性连接,全部采用显性连接了。

2. 逻辑上一个query的执行顺序(不是实际) 

1. FROM 
2. ON 
3. JOIN 
4. WHERE 
5. GROUP BY 
6. WITH CUBE or WITH ROLLUP 
7. HAVING 
8. SELECT 
9. DISTINCT 
10. ORDER BY 
11. TOP 
说是“逻辑上” 顺序,因为实际执行时还要看索引,数据分布等,看最终优化器如何处理,最真实的顺序肯定是执行计划展示的顺序。

SQL语句中join连表时on和where后都可以跟条件,那么对查询结果集,执行顺序,效率是如何呢? 通过查询资料发现: 
区别: 
on是对中间结果进行筛选,where是对最终结果筛选。 

执行顺序: 
先进行on的过滤, 而后才进行join。 

效率: 
如果是inner join, 放on和放where产生的结果一样, 但没说哪个效率速度更高? 如果有outer join (left or right), 就有区别了, 因为on生效在先, 已经提前过滤了一部分数据, 而where生效在后. 
最后来了解下T-SQL对查询逻辑处理。 
T-SQL逻辑查询的各个阶段(编号代表顺序): 
(5)SELECT DISTINCT TOP(<top_specification>) <select_list>                      
(1)FROM <left_table> <join_type> JOIN <right_table> ON <on_predicate> 
(2)WHERE <where_predicate> 
(3)GROUP BY <group_by_specification> 
(4)HAVING <having_predicate> 
(6)ORDER BY <order_by_list> 

T-SQL在查询各个阶级分别干了什么: 
(1)FROM 阶段 
    FROM阶段标识出查询的来源表,并处理表运算符。在涉及到联接运算的查询中(各种join),主要有以下几个步骤: 
  a.求笛卡尔积。不论是什么类型的联接运算,首先都是执行交叉连接(cross join),求笛卡儿积,生成虚拟表VT1-J1。 

      b.ON筛选器。这个阶段对上个步骤生成的VT1-J1进行筛选,根据ON子句中出现的谓词进行筛选,让谓词取值为true的行通过了考验,插入到VT1-J2。 

     c.添加外部行。如果指定了outer join,还需要将VT1-J2中没有找到匹配的行,作为外部行添加到VT1-J2中,生成VT1-J3。 

    经过以上步骤,FROM阶段就完成了。概括地讲,FROM阶段就是进行预处理的,根据提供的运算符对语句中提到的各个表进行处理(除了join,还有apply,pivot,unpivot) 

(2)WHERE阶段 
     WHERE阶段是根据<where_predicate>中条件对VT1中的行进行筛选,让条件成立的行才会插入到VT2中。 

(3)GROUP BY阶段 
      GROUP阶段按照指定的列名列表,将VT2中的行进行分组,生成VT3。最后每个分组只有一行。 

(4)HAVING阶段 
      该阶段根据HAVING子句中出现的谓词对VT3的分组进行筛选,并将符合条件的组插入到VT4中。 

(5)SELECT阶段 
  这个阶段是投影的过程,处理SELECT子句提到的元素,产生VT5。这个步骤一般按下列顺序进行 
        a.计算SELECT列表中的表达式,生成VT5-1。 
        b.若有DISTINCT,则删除VT5-1中的重复行,生成VT5-2 
        c.若有TOP,则根据ORDER BY子句定义的逻辑顺序,从VT5-2中选择签名指定数量或者百分比的行,生成VT5-3 

(6)ORDER BY阶段 
     根据ORDER BY子句中指定的列明列表,对VT5-3中的行,进行排序,生成游标VC6.

如果是inner join, 放on和放where产生的结果一样, 执行计划也是一样,但推荐使用on。但如果有outer join (left or right), 就有区别了, 因为on生效在先, 已经提前过滤了一部分数据, 而where生效在后,而且on对于outer join有不生效的情况,需要看and条件是作用在左表还是右表。

扩展:SQL执行顺序join在where前面

  • 取a表和b表join的数据sql

原本意图是取a表的昨日分区数据和b表的昨日分区数据进行join,但是发现加上and b.dt = '${daily}'的条件后就取不到在a表中存在的数据了

select substr(a.create_time,1,7) create_month,a.service_id,a.unit_number,a.company_name,coalesce(b.unified_social_credit_code,'unknown') unified_social_credit_code
,a.company_id,b.company_id as company_id_b,a.dt,b.dt
from clouduser.dz_company a 
left join clouduser.dz_company_detail b on a.company_id = b.company_id
where a.dt = '${daily}' 
--and b.dt = '${daily}'
and substr(a.create_time,1,7) = '2022-09'
and a.company_name = '浙江港都电子有限公司';

运行结果

在这里插入图片描述

  • 原因是where执行是在join之后,join出来的临时表中,由于在b表中没有匹配到数据,所以b.dt为null,这时候执行where b.dt = '${daily}'的条件筛选不到这条数据。
  • 优化方法

现在子查询中将b表的昨日分区查询出来,再和a表join

with
r1 as (select * from clouduser.dz_company_detail where dt = '2022-10-17'),
r2 as (
select substr(a.create_time,1,7) create_month,a.service_id,a.unit_number,a.company_name,coalesce(b.unified_social_credit_code,'unknown') unified_social_credit_code
,a.company_id,b.company_id as company_id_b
from clouduser.dz_company a 
left join r1 b on a.company_id = b.company_id
where a.dt = '${daily}' 
--and b.dt = '${daily}'
and substr(a.create_time,1,7) = '2022-09'
and a.company_name = '浙江港都电子有限公司'
)
select * from r2;

执行结果

在这里插入图片描述

可以看到正常查询出a表中的数据了

到此这篇关于join on和where执行顺序的文章就介绍到这了,更多相关join on和where执行顺序内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • MySQL长字符截断的实现示例

    MySQL长字符截断的实现示例

    本文主要介绍了MySQL长字符截断的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • jdbc中自带MySQL 连接池实践示例

    jdbc中自带MySQL 连接池实践示例

    这篇文章主要为大家介绍了jdbc中自带MySQL连接池实践示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-07-07
  • Mysql数据库监听binlog的开启步骤

    Mysql数据库监听binlog的开启步骤

    这篇文章主要给大家介绍了关于Mysql数据库监听binlog的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Mysql具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-08-08
  • 与MSSQL对比学习MYSQL的心得(二)--显示宽度

    与MSSQL对比学习MYSQL的心得(二)--显示宽度

    MYSQL中的整数型数据类型都可以指定显示宽度,而SQLSERVER不行
    2014-06-06
  • mysql严格模式Strict Mode详细说明

    mysql严格模式Strict Mode详细说明

    使用mysql严格模式可以使数据更加安全严格,缺点是减少了对空数据入库的兼容性,下面这篇文章主要给大家介绍了关于mysql严格模式Strict Mode详细说明的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-08-08
  • mysql之key和index的区别及创建删除索引方式

    mysql之key和index的区别及创建删除索引方式

    这篇文章主要介绍了mysql之key和index的区别及创建删除索引方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-12-12
  • MySql中特殊运算符的使用方法总结

    MySql中特殊运算符的使用方法总结

    这篇文章主要给大家介绍了关于MySql中特殊运算符的使用方法,分别介绍的是<=> 安全比较运算符、:= 赋值的作用、@ 用户变量以及@@ 系统变量,文中介绍的非常详细,需要的朋友可以参考下
    2018-09-09
  • MySQL如何根据不同条件联查不同表的数据if/case

    MySQL如何根据不同条件联查不同表的数据if/case

    这篇文章主要介绍了MySQL如何根据不同条件联查不同表的数据if/case问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-05-05
  • 快速理解MySQL中主键与外键的实例教程

    快速理解MySQL中主键与外键的实例教程

    这篇文章主要介绍了MySQL中主键与外键的区别和联系,是MySQL入门学习中的基础知识,需要的朋友可以参考下
    2015-11-11
  • mysql执行时间为负数的原因分析

    mysql执行时间为负数的原因分析

    今天看到有人把phpmyadmin中的执行时间出现负数的情况视为phpmyadmin的bug, 其实这种情况的本质是php中浮点数(float)的精度问题。
    2010-08-08

最新评论