猿问

熊猫直方图:从数据中提取列和分组依据

我有一个数据框,正在使用column和by熊猫的hist()方法查看数据子集的直方图,如下所示:


ax = df.hist(column='activity_count', by='activity_month')

(然后我继续绘制此信息)。我试图确定如何以编程方式提取两段数据:当我在轴上循环时,具有特定值'activity_month'以及'activity_month'的记录数:


for i,x in enumerate(ax):`  

   print("the value of a is", a)

   print("the number of rows with value of a", b)

这样我会得到:


January 1002

February 4305

etc

现在,我可以轻松获得“ activity_month”唯一值的列表,以及具有给定的activity_month等于该值的行数的计数,


a="January"

len(df[df["activity_month"]=a])

但我想针对i,x的特定迭代在循环内执行此操作。如何在每次迭代中获取“ x”内子集数据的句柄,以便查看迭代中“ activity_month”的值以及具有该值的行数?


白衣非少年
浏览 163回答 1
1回答

料青山看我应如是

这是一个简短的示例数据框:import pandas as pddf = pd.DataFrame([['January',19],['March',6],['January',24],['November',83],['February',23],                    ['November',4],['February',98],['January',44],['October',47],['January',4],                    ['April',8],['March',21],['April',41],['June',34],['March',63]],                    columns=['activity_month','activity_count'])产量:   activity_month  activity_count0         January              191           March               62         January              243        November              834        February              235        November               46        February              987         January              448         October              479         January               410          April               811          March              2112          April              4113           June              3414          March              63如果您希望从中获得每个组的值的总和df.groupby('activity_month'),则可以这样做:df.groupby('activity_month')['activity_count'].sum()给出:activity_monthApril        49February    121January      91June         34March        90November     87October      47Name: activity_count, dtype: int64要获取与给定组相对应的行数:df.groupby('activity_month')['activity_count'].agg('count')给出:activity_monthApril       2February    2January     4June        1March       3November    2October     1Name: activity_count, dtype: int64重新阅读您的问题后,我确信您没有以最有效的方式解决此问题。我强烈建议您不要显式地遍历使用创建的轴df.hist(),特别是当此信息可以快速(直接)从其df自身访问时。
随时随地看视频慕课网APP

相关分类

Python
我要回答