MySQL中distinct与group by语句的一些比较及用法讲解-原创手记-慕课网

在数据表中记录了用户验证时使用的书目，现在想取出所有书目，用DISTINCT和group by都取到了我想要的结果，但我发现返回结果排列不同，distinct会按数据存放顺序一条条显示，而group by会做个排序（一般是ASC）。

        DISTINCT 实际上和 GROUP BY 操作的实现非常相似，只不过是在 GROUP BY 之后的每组中只取出一条记录而已。所以，DISTINCT 的实现和 GROUP BY 的实现也基本差不多，没有太大的区别，同样可以通过松散索引扫描或者是紧凑索引扫描来实现。

      那DISTINCT 和GROUP BY哪个效率更高？

       DISTINCT操作只需要找出所有不同的值就可以了。而GROUP BY操作还要为其他聚集函数进行准备工作。从这一点上将，GROUP BY操作做的工作应该比DISTINCT所做的工作要多一些。

      但实际上，GROUP BY 效率会更高点，为什么呢？对于DISTINCT操作，它会读取了所有记录，而GROUP BY需要读取的记录数量与分组的组数量一样多，也就是说比实际存在的记录数目要少很多。

下面来看MySQL中distinct及group by的一些用法分享。

1234	`CREATE` `TABLE` `student` ( ``name`` `varchar(20)` `NOT` `NULL` `DEFAULT` `'',` `age` `int(10)` `DEFAULT` `'0'` `) ENGINE=InnoDB` `DEFAULT` `CHARSET=latin1`

1.测试一

1	`select` `*` `from` `student;`

123	`a 5a 5c 0`

用distinct过滤掉两列都相同的记录

1	`select` `distinct` `name,age` `from` `student;`

12 a 5c 0

2.测试二
将表student的数据改为如下：

1	`select` `*` `from` `student;`

12 c 2c 5

1	`select` `distinct` `name,age` `from` `student;`

返回如下，说明distinct后面有多于一列的字段时，只有每列的值完全相同才过滤

12 c 2c 5

3.测试三

1	`select` `*` `from` `student;`

1234	`name age heightc 2 123c 2 456b 20 222`

group by按两列同时分组

1	`select` `name,age,sum(height)` `from` `student` `group` `by` `name,age;`

12	`b 20 222c 2 579`

group by按两列同时分组，同时在后面加上having的条件

1	`select` `name,age,sum(height)` `as` `n` `from` `student` `group` `by` `name,age` `having` `n > 500;`

返回
c 2 579

4.测试四
关于group by后面limit的测试

复制代码代码如下:
select songname,sengerid,count(sengerid) as n from t_song group by songname,sengerid having n > 1 ORDER BY n DESC,songid ASC limit 10;

12345678910 未知 8738 40共同渡过 1432 24风继续吹 1432 23倩女幽魂 1432 23无心睡眠 1432 23罗百吉超嗨派对连续组曲 780 19拒绝再玩 1432 19风再起时 1432 18每天爱你多一些 1480 18千言万语 1794 18

复制代码代码如下:

select songname,sengerid,count(sengerid) as n from t_song group by songname,sengerid having n > 1 ORDER BY n DESC,songid ASC limit 5;

12345 未知 8738 40共同渡过 1432 24风继续吹 1432 23倩女幽魂 1432 23无心睡眠 1432 23

经过以上两个测试可以看出，如果sql语句中含有limit，limit是对用group by进行分组，并进行相关计算以后的limit操作，而不是对limit后面的指定记录数进行分组，从n那一列的数据每一行的值都大于10就可以看出来。

5.测试五
用以下的两种形式的distinct均可以得到相同的记录数，写法不一样，结果是一样的。

123	`select` `count(distinct(songid))` `from` `feedback;` `select` `count(distinct` `songid)` `from` `feedback;`

6.测试六
field singername is string,max(singername),如果singername有些列为空，有些列不为空，则max(singername)取非空的值，如果一列为zxx,一列为lady,则取zxx,按字母顺利取的。

复制代码代码如下:
select feedback_id,songid,songname,max(singername),max(time) as new_time from feedback group by songid order by new_time desc;

7.Sql语句中where,group by,order by及limit的顺序

1	`where` `xxx,group` `by` `xxx,order` `by` `xxx,limit xxx`

8.关于group by与count的问题
如果sql语句中含有group by，则最好不要将count sql转换为select count(*) from xxx,否则select与from之间的字段很有可能是后面要使用的，例如

复制代码代码如下:
select feedback_id,songid,songname,max(singername),max(time) as new_time from feedback group by songid order by new_time desc;

复制代码代码如下:

MySQL Query Error: SELECT COUNT(*) FROM feedback GROUP BY songid ORDER BY new_time DESC Error Info:Unknown column 'new_time' in 'order clause'