sql中表连接和子查询哪个更快（SQL优化三）

藏着真心话 2023-03-13 17:21:22

收藏赞分享

一、用法

1. 与IN结合使用

子查询与IN结合使用时，通常通过子查询查询出某个表单列的值，然后作为外层的SELECT的IN查询的数据源，如下，查询今天进行了购物的用户列表，首先通过子查询在订单表t_order查出所有今天进行了购物的用户的user_id，然后在外层SELECT中对于用户表t_user的每个用户都通过IN来判断自己的user_id是否在里面：

sql中表连接和子查询哪个更快（SQL优化三）(1)

执行计划如下：

sql中表连接和子查询哪个更快（SQL优化三）(2)

性能分析：数据集合 O(N)线性时间复杂度

对于外层SELECT对应用户表t_user的每一行数据都要执行一次这个子查询，而这个子查询是需要返回一个数据集合而不是单条数据，然后再判断外层SELECT的当前数据行的该列的值是否在这个集合中，类似于O(N)的线性时间复杂度，如Java的集合的contains方法，所以性能是很低的，即MySQL需要返回的数据量大同时查询的时间复杂度高。

2. 与EXISTS结合使用

在外层SELECT中，除了可以通过IN来使用子查询的结果外，还可以通过EXISTS，如下：与IN不同的是，在子查询中外层的t_user表需要在子查询内使用，在子查询内部才是进行实际的查询，而EXISTS的作用是根据EXISTS返回的结果，即boolean类型的true或false来决定是否需要返回该外层SELECT当前遍历到的结果。

mySQL> select * from t_user where exists (select * from t_order where t_user.id=t_order.user_id and t_order. buy_date=curdate()); ---- ------ ---------------------------------- ------------ -------- | id | name | password | email | phone | ---- ------ ---------------------------------- ------------ -------- | 2 | xyz2 | 5838eec5e44b83f35c2763382b45e469 | 456@qq.com | 456789 | ---- ------ ---------------------------------- ------------ -------- 1 row in set (0.00 sec)

执行计划如下：

mysql> explain select * from t_user where exists (select * from t_order where t_user.id=t_order.user_id and t_order. buy_date=curdate()); ---- -------------------- --------- ------------ ------ ----------------------------------------------- -------------- --------- ------- ------ ---------- ------------- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra | ---- -------------------- --------- ------------ ------ ----------------------------------------------- -------------- --------- ------- ------ ---------- ------------- | 1 | PRIMARY | t_user | NULL | ALL | NULL | NULL | NULL | NULL | 1 | 100.00 | Using where | | 2 | DEPENDENT SUBQUERY | t_order | NULL | ref | idx_user_id,idx_user_id_buy_date,idx_buy_date | idx_buy_date | 3 | const | 1 | 25.00 | Using where | ---- -------------------- --------- ------------ ------ ----------------------------------------------- -------------- --------- ------- ------ ---------- ------------- 2 rows in set, 2 warnings (0.00 sec)

性能分析：True或False的boolean值 O(1)常量时间复杂度

执行计划与IN差不多，外层SELECT的type都是ALL，即全表扫描，但是EXISTS的执行过程与IN不一致，对于EXISTS而言，外层SELECT对应的用户表t_user也参与到了子查询的SQL中，即 where t_user.id=t_order.user_id，故如果子查询的结果不为空，即存在数据，则外层SELECT对应的t_user表的当前数据行肯定是符合要求的，故该子查询实际上并不返回任何数据，而是返回值True或False，不需要与IN一样返回一个数据集合。
而对外层SELECT来说，通过EXISTS判断子查询返回的boolean值True或者False来判断当前数据行是否符合要求，故时间复杂度为常量级别O(1)。

二、优化方法

1. 使用EXISTS替代IN

由以上的分析可知，在使用子查询时，将EXISTS结合使用比与IN结合使用效率更高，所以可以使用EXISTS来替代IN。

2. 使用JOIN替代子查询

子查询不管是使用IN还是EXISTS，对外层SELECT对应的数据表均需要进行全表扫描，并且对于每行数据都需要执行一次子查询，所以如果该数据行表很大，则需要执行大量的子查询，，即可能出现“大表驱动小表”，从而产生性能问题。
对于JOIN而言，由于可以通过“小表驱动大表”，并且进行JOIN的列都加了索引，所以可以一定程度上优化子查询，如下：还是查询今天进行了购物的用户：

sql中表连接和子查询哪个更快（SQL优化三）(3)

3. 子查询和JOIN均不用，程序控制

如果数据表较大时，使用子查询和JOIN效率均不高，并且对于JOIN而言，会影响分库分表的使用，故可以对需要关联的表分别查询出来，然后在程序中进行数据拼接组装操作，从而减轻数据库的压力，因为数据库通常是应用的性能瓶颈，而应用程序通常可以进行分布式和集群部署来拓展。
除此之外，对于拼接的结果可以缓存到分布式缓存，如Redis中，从而可以重复使用。

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

猜您喜欢

死亡诗社告诉我们什么（死亡诗社讲述人生永恒的难题）

這般琉璃
百年复兴路朗诵（百年百篇留声复兴之路）

猫性小公主
正宫醉太平无名氏赏析（正宫醉太平咏螃蟹）

左手誓言
手帐百搭装饰绘画高端大气高雅（帅气潇洒的穿搭女孩和浪漫的向日葵画出来是什么样的呢）

执笔诠释
童祥苓现代京剧智取威虎山完整版（由京剧智取威虎山演员童祥苓说起）

她失他心
三十岁男星官宣得子一家三口（55岁男星九孔老来得女）

我命孤独
今年最流行的西装款式（2022年西装十六大流行款式）

等待那句

秒懂生活

sql中表连接和子查询哪个更快（SQL优化三）

猜您喜欢

死亡诗社告诉我们什么（死亡诗社讲述人生永恒的难题）

百年复兴路朗诵（百年百篇留声复兴之路）

正宫醉太平无名氏赏析（正宫醉太平咏螃蟹）

手帐百搭装饰绘画高端大气高雅（帅气潇洒的穿搭女孩和浪漫的向日葵画出来是什么样的呢）

童祥苓现代京剧智取威虎山完整版（由京剧智取威虎山演员童祥苓说起）

三十岁男星官宣得子一家三口（55岁男星九孔老来得女）

今年最流行的西装款式（2022年西装十六大流行款式）

热门推荐

排行榜