如何在相似的行名上使用 Pandas 识别模式

在尝试获取总和之前，您可以处理标点符号，空格和大写字母与更低的值，但它会更改输出中供应商的名称：df.groupby([x.upper().replace(' ', '').replace(',','').replace('.','') for x in df['Vendor']])['Spend'].sum()ABCINC    460您还可以在调用组之前就地修改列名：df['Vendor'] = df['Vendor'].str.upper().str.replace(' ', '').str.replace(',','').str.replace('.','')print(df.groupby('Vendor')['Spend'].sum())df 现在如下所示：   Vendor Site  Spend0  ABCINC    A    3001  ABCINC    B    1002  ABCINC    C     503  ABCINC    D     10和输出：ABCINC    460

如何在相似的行名上使用 Pandas 识别模式

1回答