MySQL中union和join语句使用区别的辨析教程

更新时间：2015年12月16日 11:02:34 作者：古腾龙

这篇文章主要介绍了MySQL中union和join语句的用法区别,举例说明了union和join在连接操作上的不同作用,需要的朋友可以参考下

union和join是需要联合多张表时常见的关联词，具体概念我就不说了，想知道上网查就行，因为我也记不准确。
先说差别：union对两张表的操作是合并数据条数，等于是纵向的，要求是两张表字段必须是相同的(Schema of both sides of union should match.)。也就是说如果A表中有三条数据，B表中有两条数据，那么A union B就会有五条数据。说明一下union 和union all的差别，对于union如果存在相同的数据记录会被合并，而union all不会合并相同的数据记录，该有多少条记录就会有多少条记录。例如在mysql下执行以下语句：

select * from tmp_libingxue_a;
name number
libingxue 1001
yuwen 1002
select * from tmp_libingxue_b;
name number
libingxue 1001
feiyao 1003
select * from tmp_libingxue_a union select * from tmp_libingxue_b;
libingxue 1001
yuwen 1002
feiyao 1003
select * from tmp_libingxue_a union all select * from tmp_libingxue_b;
libingxue 1001
yuwen 1002
libingxue 1001
feiyao 1003

但是这样在hive里面是不能执行的，执行select * from tmp_libingxue_a union all select * from tmp_libingxue_b;会failed，hive中union必须在子查询中进行。如

select * from (select * from tmp_yuwen_a union all select * from tmp_yuwen_b) t1;

注意，必须是union all，单独用union它会提示你缺少ALL，而且后面的t1必须写，你可以写成a或者b，但是一定要写，不写会出错。
而join则是偏于横向的联合，仅仅是偏向于，等下详细说明。join跟union比起来显得更宽松，对两个表的字段不做要求，没有限制条件的join等于两个表的笛卡尔乘积，所有join需要有限制条件来约束，经过限制的join就是横向的扩张了。对于满足限制条件的join会被提取出来，不满足的直接过滤掉。用法可以很灵活，下面有两个简单的例子：

select * from (select * from tmp_yuwen_a）t1 join (select * from tmp_yuwen_b) t2;
select * from tmp_yuwen_a t1 join (select * from tmp_yuwen_b) t2;

left outer join和right outer join用法类似，区别就是left outer join会把左边表的字段全部选择出来，右边表的字段把符合条件的也选择出来，不满足的全部置空，也就是说以左边表为参照。right outer join同理以右边表为参照。这三个join之间的差别说过很多次，网上也有更详细的解释，不再赘述。
相同点：在某些特定的情况下，可以用join实现union all的功能，这种情况是有条件的，当出现这种情况的时候选择union all还是group by就可以看情况或者看两者的消耗而决定。sql虽然就在那么几个关键词，但变化多端、功能强大，只要能实现想要的功能，怎么用随便你。需求情况sql简单重现如下

drop table tmp_libingxue_resource;
create external table if not exists tmp_libingxue_resource(
  user_id string,
  shop_id string,
  auction_id  string,
  search_time  string
)partitioned by (pt string)
row format delimited fields terminated by '\t'
lines terminated by '\n'
stored as sequencefile;

drop table tmp_libingxue_result;
create external table if not exists tmp_libingxue_result(
  user_id string,
  shop_id string,
  auction_id  string,
  search_time  string
)partitioned by (pt string)
row format delimited fields terminated by '\t'
lines terminated by '\n'
stored as sequencefile;

insert overwrite table tmp_libingxue_result where(pt=20041104) select * from tmp_libingxue_resource;

sudo -u taobao hadoop dfs -rmr /group/tbads/warehouse/tmp_libingxue_result/pt=20041104
sudo -u taobao hadoop jar /home/taobao/dataqa/framework/DailyReport.jar com.alimama.loganalyzer.tool.SeqFileLoader tmp_libingxue_resource.txt hdfs://v039182.sqa.cm4:54310/group/tbads/warehouse/tmp_libingxue_result/pt=20041104/part-00000

hive> select * from tmp_libingxue_resource;

OK
2001 0  11  101  20041104
2002 0  11  102  20041104

hive> select * from tmp_libingxue_result;

OK
2001 0  12  103  20041104
2002 0  12  104  20041104

select user_id,shop_id,max(auction_id),max(search_time)
from
(select * from tmp_libingxue_resource 
union all
select * from tmp_libingxue_result )t1
group by user_id,shop_id;

2001 0  12  103
2002 0  12  104

select t1.user_id,t1.shop_id,t2.auction_id,t2.search_time
from
(select * from tmp_libingxue_resource) t1
join
(select * from tmp_libingxue_result) t2
on t1.user_id=t2.user_id and t1.shop_id=t2.shop_id;

2001 0  12  103
2002 0  12  104

通过前面的介绍，使用UNION对表的结果集进行并运算与使用JOIN对多表进行连接，二者有本质的不同。
下面给出一个使用UNION运算符连接二表记录的运算实例。
典型的二表记录的UNION运算

假定有两个表Table3和Table4，其包含的列和数据分别如下所示。

Table1数据库表

20151216110017983.png (591×135)

Table2数据库表

20151216110102452.png (582×131)

Table1表和Table2表具有相同的列结构，因此可以使用UNION运算符连接两个表的记录集，得到的连接结果如下表所示。

使用UNION连接Table3表和Table4表的记录

20151216110125850.png (589×272)

上述连接过程的实现代码可表示如下：

SELECT *
FROM Table1
UNION
SELECT *
FROM Table2

您可能感兴趣的文章:

深入分析mysql为什么不推荐使用uuid或者雪花id作为主键
这篇文章主要介绍了深入分析mysql为什么不推荐使用uuid或者雪花id作为主键,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-09-09
MYSQL复杂查询练习题以及答案大全(难度适中)
在我们学习mysql数据库时需要一些题目进行练习,下面这篇文章主要给大家介绍了关于MYSQL复杂查询练习题以及答案的相关资料,文中通过实例代码介绍的非常详细,这些练习题难度适中,需要的朋友可以参考下
2022-08-08
MySQL中三种关联查询方式的简单比较
这篇文章主要介绍了MySQL中三种关联查询方式的简单比较,即ON和USING还有传统的FROM...WHERE...,需要的朋友可以参考下
2015-06-06
MySQL数据库常见字段类型长度汇总大全
这篇文章主要给大家介绍了关于MySQL数据库常见字段类型长度汇总大全的相关资料,需要的朋友可以参考下
2024-05-05
Mysql的row_number函数使用介绍
这篇文章主要为大家介绍了Mysql的row_number函数使用原理详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-09-09
linux 下配置安装mysql以及配置【经验】
这篇文章主要介绍了linux 下配置安装mysql以及配置【经验】,需要的朋友可以参考下
2016-05-05
如何开启mysql中的严格模式
这篇文章介绍了如何开启mysql中的严格模式，有需要的朋友可以参考一下
2013-09-09
mysql 关键词相关度排序方法详细示例分析
以下是对mysql关键词相关度排序方法进行了详细的分析介绍，需要的朋友可以过来参考下
2013-08-08
关于mysql合并表的详细介绍
本篇文章是对mysql中的合并表进行了详细的分析介绍，需要的朋友参考下
2013-06-06
mysql的单列多值存储实例详解
数据库市场需要细分,行式数据库不再满足所有的需求,而有很多需求需要,下面这篇文章主要给大家介绍了关于mysql单列多值存储的相关资料,文中通过示例代码介绍介绍的非常详细,需要的朋友可以参考下
2022-04-04

MySQL中union和join语句使用区别的辨析教程

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具