概述
一条普通的SQL查询语句它在MySQL数据库中是怎么样被解析和执行的呢?下面一起来了解一下,MySQL是如何解析SQL查询语句的,这对理解MySQL的执行计划也大有益处。
解析顺序
下面是一条普通的SQL查询语句伪代码
SELECT DISTINCT
< select_list >
FROM
< left_table > < join_type >
JOIN < right_table > ON < join_condition >
WHERE
< where_condition >
GROUP BY
< group_by_list >
HAVING
< having_condition >
ORDER BY
< order_by_condition >
LIMIT < limit_number >
它的解析顺序,实际上是下面这样子的
1 FROM
2 ON
3 JOIN 第2步和第3步会循环执行
4 WHERE 第4步会循环执行,多个条件的执行顺序是从左往右的。
5 GROUP BY
6 HAVING
7 SELECT 分组之后才会执行SELECT
8 DISTINCT
9 ORDER BY
10 LIMIT 前9步都是SQL92标准语法。limit是MySQL的独有语法。
MySQL是关系型数据库,基于行和列的结构。SQL语句查询,目的就是检索数据库中符合条件的数据行和列,反过来说就是把结果集中不符合条件的数据行和列过滤掉,然后返回符合条件的数据行和列。从整个角度出发,可以把一条SQL语句及其解析顺序的构成归纳以下4个部分
行过滤
步骤1~6对数据行进行过滤
列过滤
步骤7~8对数据列进行过滤
排序
步骤9对数据结果进行排序
分页
步骤10是MySQL特有的属性,它对数据结果进行分页
解析细节分析
FROM
对FROM的左边的表和右边的表数据进行笛卡尔积(CROSS JOIN)运算,产生虚表VT1。产生的虚表VT1将传递给下一步骤进行运算。
ON过滤
对虚表VT1进行ON筛选,符合条件的数据行被记录在虚表VT2中。
OUTER JOIN添加外部列
如果指定了 OUTER JOIN(比如LEFT JOIN、 RIGHT JOIN),【主表中未匹配的数据行】也会保留添加到虚拟表VT2 中,产生虚拟表VT3
。 如果FROM子句中包含两个以上的表的话,那么就会对上一个JOIN连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤,一直到处理完所有的表为止。
WHERE
对虚拟表VT3 进行WHERE条件过滤。只有符合的记录才会被插入到虚拟表VT4中。
GROUP BY
根据group by子句中的列,对VT4中的记录进行分组操作,产生虚拟表VT5 。
HAVING
对虚拟表VT5应用having过滤,符合的记录会被插入到虚拟表VT6中。
SELECT
这个子句对SELECT子句中的元素进行处理,生成VT7表。
DISTINCT
寻找VT7中的重复列,并删掉,生成VT8。如果在查询中指定了DISTINCT子句,则会创建一张内存临时表(如果内存放不下,就需要存放在硬盘了)。这张临时表的表结构和上一步产生的虚拟表VT7是一样的,不同的是对进行DISTINCT操作的列增加了一个唯一索引,以此来除重复数据。
ORDER BY
从VT8中的表中,根据ORDER BY 子句的条件对结果进行排序,生成VT9表。
LIMIT
LIMIT子句从上一步得到的 VT9虚拟表 中选出从指定位置开始的指定行数据。
总结
鱼骨图
网上有人将SQL解析顺序用图表表示,很像一条鱼骨,也很形象
SQL语句解析顺序
流程分析
每个步骤中,都会产生一个虚表记录过滤后的数据结果集,然后将传递给下一步骤进行运算。
1. FROM(将最近的两张表,进行笛卡尔积)---VT1
2. ON(将VT1按照它的条件进行过滤)---VT2
3. LEFT|RIGHT JOIN(保留主表的记录)---VT3
4. WHERE(过滤VT3中的记录)--VT4…VTn
5. GROUP BY(对VT4的记录进行分组)---VT5
6. HAVING(对VT5中的记录进行过滤)---VT6
7. SELECT(对VT6中的记录,选取指定的列)--VT7
8. DISTINCT (寻找VT7中的重复列,并删掉)--VT8
9. ORDER BY(对VT8的记录进行排序)--VT9
10. LIMIT(对排序之后的值进行分页)--MySQL特有的语法
WHERE条件解析顺序
MySQL :从左往右去执行WHERE条件的。
Oracle :从右往左去执行WHERE条件的。