在数据表中记录了用户验证时使用的书目,现在想取出所有书目,用DISTINCT和group by都取到了我想要的结果,但我发现返回结果排列不同,distinct会按数据存放顺序一条条显示,而group by会做个排序(一般是ASC)。
DISTINCT 实际上和 GROUP BY 操作的实现非常相似,只不过是在 GROUP BY 之后的每组中只取出一条记录而已。所以,DISTINCT 的实现和 GROUP BY 的实现也基本差不多,没有太大的区别,同样可以通过松散索引扫描或者是紧凑索引扫描来实现。
那DISTINCT 和GROUP BY哪个效率更高?
DISTINCT操作只需要找出所有不同的值就可以了。而GROUP BY操作还要为其他聚集函数进行准备工作。从这一点上将,GROUP BY操作做的工作应该比DISTINCT所做的工作要多一些。
但实际上,GROUP BY 效率会更高点,为什么呢?对于DISTINCT操作,它会读取了所有记录,而GROUP BY需要读取的记录数量与分组的组数量一样多,也就是说比实际存在的记录数目要少很多。
下面来看MySQL中distinct及group by的一些用法分享。
?
1234 | CREATE TABLE `student` ( ` name ` varchar (20) NOT NULL DEFAULT '' , `age` int (10) DEFAULT '0' ) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
1.测试一
?
1 | select * from student; |
?
123 | a 5 a 5 c 0 |
用distinct过滤掉两列都相同的记录
?
1 | select distinct name ,age from student; |
返回
?
12 | a 5 c 0 |
2.测试二
将表student的数据改为如下:
?
1 | select * from student; |
?
12 | c 2 c 5 |
?
1 | select distinct name ,age from student; |
返回如下,说明distinct后面有多于一列的字段时,只有每列的值完全相同才过滤
?
12 | c 2 c 5 |
3.测试三
?
1 | select * from student; |
?
1234 | name age height c 2 123 c 2 456 b 20 222 |
group by按两列同时分组
?
1 | select name ,age, sum (height) from student group by name ,age; |
?
12 | b 20 222 c 2 579 |
group by按两列同时分组,同时在后面加上having的条件
?
1 | select name ,age, sum (height) as n from student group by name ,age having n > 500; |
返回
c 2 579
4.测试四
关于group by后面limit的测试
复制代码 代码如下:
select songname,sengerid,count(sengerid) as n from t_song group by songname,sengerid having n > 1 ORDER BY n DESC,songid ASC limit 10;
?
12345678910 | 未知 8738 40 共同渡过 1432 24 风继续吹 1432 23 倩女幽魂 1432 23 无心睡眠 1432 23 罗百吉超嗨派对连续组曲 780 19 拒绝再玩 1432 19 风再起时 1432 18 每天爱你多一些 1480 18 千言万语 1794 18 |
复制代码 代码如下:
select songname,sengerid,count(sengerid) as n from t_song group by songname,sengerid having n > 1 ORDER BY n DESC,songid ASC limit 5;
?
12345 | 未知 8738 40 共同渡过 1432 24 风继续吹 1432 23 倩女幽魂 1432 23 无心睡眠 1432 23 |
经过以上两个测试可以看出,如果sql语句中含有limit,limit是对用group by进行分组,并进行相关计算以后的limit操作,而不是对limit后面的指定记录数进行分组,从n那一列的数据每一行的值都大于10就可以看出来。
5.测试五
用以下的两种形式的distinct均可以得到相同的记录数,写法不一样,结果是一样的。
?
123 | select count ( distinct (songid)) from feedback; select count ( distinct songid) from feedback; |
6.测试六
field singername is string,max(singername),如果singername有些列为空,有些列不为空,则max(singername)取非空的值,如果一列为zxx,一列为lady,则取zxx,按字母顺利取的。
复制代码 代码如下:
select feedback_id,songid,songname,max(singername),max(time) as new_time from feedback group by songid order by new_time desc;
7.Sql语句中where,group by,order by及limit的顺序
?
1 | where xxx, group by xxx, order by xxx,limit xxx |
8.关于group by与count的问题
如果sql语句中含有group by,则最好不要将count sql转换为select count(*) from xxx,否则select与from之间的字段很有可能是后面要使用的,例如
复制代码 代码如下:
select feedback_id,songid,songname,max(singername),max(time) as new_time from feedback group by songid order by new_time desc;
复制代码 代码如下:
MySQL Query Error: SELECT COUNT(*) FROM feedback GROUP BY songid ORDER BY new_time DESC Error Info:Unknown column 'new_time' in 'order clause'