手记

盘点一道Pandas中分组聚合groupby()函数用法的基础题

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【Chloé】的粉丝问了一个关于Pandas中groupby函数的问题,这里拿出来给大家分享下,一起学习。

这个粉丝在法国留学,所以提问是英文的,当然了英文看上去也不难,有点二级英文基础,也看得懂,实在不行,在线翻译一下也问题不大了。

二、解决过程

这里给出【dcpeng】大佬和【月神】的解答。

【dcpeng】的解答

gruopby是分组的意思,这个我们都知道。python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!

对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:

df.groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)

如上图所示,前面是没问题的,后面有个地方他的解析有点问题,好在有【月神】补充,一起来看看吧!

【月神】的解答

从这个图里可以看出来使用driver_gender列对data进行聚合后再对search_conducted列进行分组求和。.sum()就是求和函数,对指定数据列进行相加。

上面【dcpeng】大佬认为这个search_conducted是个函数,其实不是,它是指分类的属性,数据的限定,search_conducted是具体的列,需要结合数据查看。其实说白了,就只是针对分组后的search_conducted列进行sum求和。

【月神】在这里还多了一些拓展,详情如下图所示。

此图一出,小伙伴们直呼好家伙,确实太清晰了,一目了然!

三、总结

大家好,我是Python进阶者。这篇文章基于粉丝提问,针对Pandas中分组聚合groupby()函数用法的基础题问题,给出了具体说明和演示,顺利地帮助粉丝解决了问题。

总的来说,python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:

df.groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)

最后感谢粉丝【Chloé】提问,感谢【月神】和【dcpeng】大佬给出的示例和代码支持,感谢粉丝【冫马讠成】、【Zhang Zhiyu】、【PI】、【东哥】、【艾希·觉罗】、【༺ཉི།།与歌同行ཉྀ༻】、【Toria D.】、【༺⃰ཊ⃰-听风-ཏ⃰༻⃰】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

0人推荐
随时随地看视频
慕课网APP