按总和条件分组

你可以这样做：import pandas as pddf = pd.DataFrame({'Date' : ['1', '1', '1', '1'],                'Ref' : ['one', 'one', 'two', 'two'],                'P' : ['50', '65', '30', '38'],                'PP' : ['63', '63', '32', '32'],                'Q' : ['10', '15', '20', '10']})def conditional_sum(x):    return x[x['P'] >= x['PP']].Q.sum()result = df.groupby(['Date','Ref']).apply(conditional_sum)print(result)输出Date  Ref1     one    15      two    10dtype: object更新如果要对输出中的多列求和，可以使用loc：def conditional_sum(x):    return x.loc[x['P'] >= x['PP'], ['Q', 'P']].sum()result = df.groupby(['Date', 'Ref']).apply(conditional_sum)print(result)输出             Q     PDate Ref            1    one  15.0  65.0     two  10.0  38.0请注意，在上面的示例中，我使用 columnP是为了展示如何处理多列。

按总和条件分组

2回答