pandas多条件分组排序问题 row_number

df = pd.DataFrame({'key1' : ['a','a','a','b','b'],    'key2' : ['c','d','c','c','d'],    'data' : [1,10,2,3,30]})

>>> df
  key1 key2  data0    a    c     11    a    d    102    a    c     23    b    c     34    b    d    30目标结果
key1 key2  data  row_number0    a    c     1     11    a    d    10     12    a    c     2     23    b    c     3     14    b    d    30     1

以key1、key2分组,按照data排序,取出序号应该怎么处理呢?搜索找到的以下方法没有成功

df['row_number'] = df['data'].groupby(df['key1','key2']).rank(ascending=True,method='first')


潇潇雨雨
浏览 447回答 2
2回答

守着一只汪

def cumsum_seq(v):    sub = v.sort_values('data')    sub['seq'] = sub['seq'].cumsum()    return sub.loc[:, ['data', 'seq']] df['seq'] = 1df.groupby(['key1', 'key2']).apply(cumsum_seq).reset_index().drop(columns='level_2')

翻翻过去那场雪

key1key2dataseq0ac111ac222ad1013bc314bd301
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python