SQL Group By子句

在本教程中，您将学习如何使用SQL GROUP BY子句根据一列或多列对行进行分组。

1. SQL GROUP BY子句简介

分组是使用数据库时必须处理的最重要任务之一。要将行分组，请使用GROUP BY子句。

GROUP BY子句是SELECT语句的可选子句，它根据指定列中的匹配值将行组合成组，每组返回一行。

经常将GROUP BY与MIN，MAX，AVG，SUM或COUNT等聚合函数结合使用，以计算为每个分组提供信息的度量。

以下是GROUP BY子句的语法。

SELECT
    column1,
    column2,
    AGGREGATE_FUNCTION (column3)
FROM
    table1
GROUP BY
    column1,
    column2;

在SELECT子句中包含聚合函数不是强制性的。但是，如果使用聚合函数，它将计算每个组的汇总值。

如果要在分组之前过滤行，请添加WHERE子句。但是要过滤组，请使用HAVING子句。
需要强调的是，在对行进行分组之前应用WHERE子句，而在对行进行分组之后应用HAVING子句。换句话说，WHERE子句应用于行，而HAVING子句应用于分组。

要对组进行排序，请在GROUP BY子句后添加ORDER BY子句。

GROUP BY子句中出现的列称为分组列。如果分组列包含NULL值，则所有NULL值都汇总到一个分组中，因为GROUP BY子句认为NULL值相等。

2. SQL GROUP BY示例

我们将使用示例数据库中的employees和departments表来演示GROUP BY子句的工作方式。

要查找每个部门的员工数量，请按department_id列对员工进行分组，并将COUNT函数应用于每个组，如下所示：

SELECT
    department_id,
    COUNT(employee_id) headcount
FROM
    employees
GROUP BY
    department_id;

执行上面查询语句，得到以下结果：

2.1. SQL GROUP BY带有INNER JOIN示例

要获取部门名称，请使用departments表将employees表连接，如下所示：

SELECT
    e.department_id,
    department_name,
    COUNT(employee_id) headcount
FROM
    employees e
INNER JOIN departments d ON d.department_id = e.department_id
GROUP BY
    e.department_id;

执行上面查询语句，得到以下结果：

2.2. SQL GROUP BY带有ORDER BY示例
要按人数排序部门，请添加ORDER BY子句作为以下语句：

SELECT 
    e.department_id,
    department_name,
    COUNT(employee_id) headcount
FROM
    employees e
        INNER JOIN
    departments d ON d.department_id = e.department_id
GROUP BY e.department_id
ORDER BY headcount DESC;

执行上面查询语句，得到以下结果：

注意，可以在ORDER BY子句中使用headcount别名或COUNT(employee_id)。

2.3. SQL GROUP BY有HAVING示例
要查找人数大于5的部门，请使用HAVING子句，如下查询语句：

SELECT 
    e.department_id,
    department_name,
    COUNT(employee_id) headcount
FROM
    employees e
        INNER JOIN
    departments d ON d.department_id = e.department_id
GROUP BY e.department_id
HAVING headcount > 5
ORDER BY headcount DESC;

执行上面查询语句，得到以下结果：

+---------------+-----------------+-----------+
| department_id | department_name | headcount |
+---------------+-----------------+-----------+
|             5 | 运输            |         7 |
|             3 | 采购            |         6 |
|            10 | 财务            |         6 |
|             8 | 销售            |         6 |
+---------------+-----------------+-----------+
4 rows in set

2.4. SQL GROUP BY与MIN，MAX和AVG示例

以下查询返回每个部门中员工的最低，最高和平均工资。

SELECT 
    e.department_id,
    department_name,
    MIN(salary) min_salary,
    MAX(salary) max_salary,
    ROUND(AVG(salary), 2) average_salary
FROM
    employees e
        INNER JOIN
    departments d ON d.department_id = e.department_id
GROUP BY e.department_id;

执行上面示例代码，得到以下结果：

2.5. SQL GROUP BY带有SUM函数示例

要获得每个部门的总薪水，请将SUM函数应用于salary列，并通过department_id列分组员工，如下所示：

SELECT 
    e.department_id,
    department_name,
    SUM(salary) total_salary
FROM
    employees e
        INNER JOIN
    departments d ON d.department_id = e.department_id
GROUP BY e.department_id;

执行上面查询语句，得到以下结果：

+---------------+-----------------+--------------+
| department_id | department_name | total_salary |
+---------------+-----------------+--------------+
|             1 | 管理            | 4400.00      |
|             2 | 市场营销        | 19000.00     |
|             3 | 采购            | 24900.00     |
|             4 | 人力资源        | 6500.00      |
|             5 | 运输            | 41200.00     |
|             6 | IT              | 28800.00     |
|             7 | 公共关系        | 10000.00     |
|             8 | 销售            | 57700.00     |
|             9 | 行政人员        | 58000.00     |
|            10 | 财务            | 51600.00     |
|            11 | 会计            | 20300.00     |
+---------------+-----------------+--------------+
11 rows in set

2.6. SQL GROUP BY多列
到目前为止，您已经看到将所有员工分组为一列。例如，以下子句 -

GROUP BY department_id

将所有具有相同值的行放在一个组的department_id列中。如何按department_id和job_id列中的值对员工进行分组？

GROUP BY department_id, job_id

此子句将在一个组的department_id和job_id列中为所有具有相同值的员工进行分组。
以下语句将同一组中department_id和job_id列中具有相同值的行分组，然后返回每个组的行。

SELECT 
    e.department_id,
    department_name,
    e.job_id,
    job_title,
    COUNT(employee_id)
FROM
    employees e
        INNER JOIN
    departments d ON d.department_id = e.department_id
        INNER JOIN
    jobs j ON j.job_id = e.job_id
GROUP BY e.department_id , e.job_id;

执行上面示例代码，得到以下结果：

第2,3和5部门不止一个。

这是因为这些部门的员工有不同的工作。例如，在运输部门，有2名员工在运输业务员工作，1名员工在库存员工作，4名员工在库存管理员工作。

2.7. SQL GROUP BY和DISTINCT
如果使用GROUP BY子句而不使用聚合函数，则GROUP BY子句的行为类似于DISTINCT运算符。

以下内容获取员工的电话号码，并按电话号码分组。

SELECT
    phone_number
FROM
    employees
GROUP BY
    phone_number;

注意，电话号码已排序。

以下语句还检索电话号码，但不使用GROUP BY子句，而是使用DISTINCT运算符。

ELECT DISTINCT
    phone_number
FROM
    employees;

结果集是相同的，只是DISTINCT运算符返回的结果集没有排序。

在本教程中，我们向您展示了如何使用GROUP BY子句将行汇总到分组中，并将聚合函数应用于每个分组。

上一篇： SQL Sum()函数下一篇： SQL Having子句

1. SQL GROUP BY子句简介

2. SQL GROUP BY示例

HTML / CSS

脚本语言

高级语言

Java技术

XML技术

大数据

开发工具

框架

软件测试

前端技术

数据库

其他技术