您的位置：首页 > 数据库 > MySQL

（MySql）distinct、group by去重

2017-05-25 09:08 309 查看

1、mysql distinct 去重

在使用mysql时，有时需要查询出某个字段不重复的记录，虽然mysql提供有distinct这个关键字来过滤掉多余的重复记录只保留一条，但往往只用它来返回不重复记录的条数，而不是用它来返回不重记录的所有值。其原因是
distinct只能返回它的目标字段，而无法返回其它字段。

下面先来看看例子：

     table

   id name

   1 a

   2 b

   3 c

   4 c

   5 b

库结构大概这样，这只是一个简单的例子，实际情况会复杂得多。

比如我想用一条语句查询得到name不重复的所有数据，那就必须使用distinct去掉多余的重复记录。

select distinct name from table

得到的结果是:

   name

   a

   b

   c

好像达到效果了，可是，我想要得到的是id值呢？改一下查询语句吧:

select distinct name, id from table

结果会是:

   id name

   1 a

   2 b

   3 c

   4 c

   5 b

distinct怎么没起作用？作用是起了的，不过他同时作用了两个字段，也就是必须得id与name都相同的才会被排除。

我们再改改查询语句:

select id, distinct name from table

很遗憾，除了错误信息你什么也得不到，distinct必须放在开头。难到不能把distinct放到where条件里？能，照样报错。。。。。。。

2、mysql group by 去重

现在将完整语句放出:

select *, count(distinct name) from table group by name

结果:

   id name count(distinct name)

   1 a 1

   2 b 1

   3 c 1

最后一项是多余的，不用管就行了，目的达到。

其实还可以更简化：

select id, name from table group by name

查询出来的结果也是一样的

3、group by 用法解析
group by语法可以根据给定数据列的每个成员对查询结果进行分组统计，最终得到一个分组汇总表。

SELECT子句中的列名必须为分组列或列函数。列函数对于GROUP BY子句定义的每个组各返回一个结果。

某个员工信息表结构和数据如下：
id name dept salary edlevel hiredate
      1 张三开发部 2000 3 2009-10-11
      2 李四开发部 2500 3 2009-10-01
      3 王五设计部 2600 5 2010-10-02
      4 王六设计部 2300 4 2010-10-03

e0f3
     5 马七设计部 2100 4 2010-10-06
      6 赵八销售部 3000 5 2010-10-05
      7 钱九销售部 3100 7 2010-10-07

      8 孙十销售部 3500 7 2010-10-06

例如，我想列出每个部门最高薪水的结果，sql语句如下：
SELECT DEPT, MAX(SALARY) AS MAXIMUM
FROM STAFF

GROUP BY DEPT

查询结果如下：
      DEPT MAXIMUM
      开发部 2500
      设计部 2600

      销售部 3500

解释一下这个结果：
1、满足“SELECT子句中的列名必须为分组列或列函数”，因为SELECT有GROUP BY DEPT中包含的列DEPT。
2、“列函数对于GROUP BY子句定义的每个组各返回一个结果”，根据部门分组，对每个部门返回一个结果，就是每个部门的最高薪水。

注意：计算的是每个部门（由 GROUP BY 子句定义的组）而不是整个公司的 MAX(SALARY)。

例如，查询每个部门的总的薪水数
SELECT DEPT, sum( SALARY ) AS total
FROM STAFF

GROUP BY DEPT

查询结果如下：
DEPT total
开发部 4500
设计部 7000

销售部 9600

将 WHERE 子句与 GROUP BY 子句一起使用

分组查询可以在形成组和计算列函数之前具有消除非限定行的标准 WHERE 子句。必须在GROUP BY 子句之前指定 WHERE 子句。

例如，查询公司2010年入职的各个部门每个级别里的最高薪水
SELECT DEPT, EDLEVEL, MAX( SALARY ) AS MAXIMUM
FROM staff
WHERE HIREDATE > '2010-01-01'
GROUP BY DEPT, EDLEVEL

ORDER BY DEPT, EDLEVEL

查询结果如下：
DEPT EDLEVEL MAXIMUM
      设计部 4 2300
      设计部 5 2600
      销售部 5 3000

      销售部 7 3500

注意：在SELECT语句中指定的每个列名也在GROUP BY子句中提到。未在这两个地方提到的列名将产生错误。GROUP BY子句对DEPT和EDLEVEL的每个唯一组合各返回一行。

在GROUP BY子句之后使用HAVING子句可应用限定条件进行分组，以便系统仅对满足条件的组返回结果。为此，在GROUP
BY子句后面包含一个HAVING子句。HAVING子句可包含一个或多个用AND和OR连接的谓词。每个谓词将组特性（如AVG(SALARY)）与下列之一进行比较：
例如：寻找雇员数超过2个的部门的最高和最低薪水：
SELECT DEPT, MAX( SALARY ) AS MAXIMUM, MIN( SALARY ) AS MINIMUM
FROM staff
GROUP BY DEPT
HAVING COUNT( * ) >2

ORDER BY DEPT

查询结果如下：
DEPT MAXIMUM MINIMUM
      设计部 2600 2100

      销售部 3500 3000

例如：寻找雇员平均工资大于3000的部门的最高和最低薪水：

SELECT DEPT, MAX( SALARY ) AS MAXIMUM, MIN( SALARY ) AS MINIMUM

FROM staff
GROUP BY DEPT
HAVING AVG( SALARY ) >3000

ORDER BY DEPT

查询结果如下：
DEPT MAXIMUM MINIMUM

      销售部 3500 3000

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航