猿问

如何基于其他列在Python中创建排名列

我有一个 python 数据框,如下所示:

此数据框已按“transaction_count”降序排序。我想在该数据框中创建另一个名为“rank”的列,其中包含 cust_ID 的出现次数。我的愿望输出如下所示:

http://img.mukewang.com/615c01d600012af204030167.jpg

对于 cust_ID = 1234 且 transaction_count = 4,等级将为 1,对于 cust_ID = 1234 的下一次出现,等级将为 2,依此类推。


我尝试了以下方法:


df['rank'] = df["cust_ID"].value_counts()

df.head(10)

但是排名列被创建为所有 NaN 值 

http://img1.mukewang.com/615c01ec000155ca00430273.jpg

任何关于如何解决这个问题的建议将不胜感激!


慕田峪9158850
浏览 274回答 2
2回答

湖上湖

你可以做:df['rank'] = df.groupby('cust_ID')['transaction_count'].rank(ascending=False)输出:    cust_ID     associate_ID    transaction_count   rank0   1234           608          4                   1.01   1234           785          1                   2.02   4789           345          2                   1.03   3456           268          5                   1.04   3456           725          3                   2.05   3456           795          1                   3.0请注意,这不仅会给出计数,还会基于transaction_count值给出交易的排名。

LEATH

使用groupby + cumcount:df['rank'] = df.groupby('cust_ID').cumcount() + 1print(df['rank'])输出0    11    22    13    14    25    3Name: rank, dtype: int64
随时随地看视频慕课网APP

相关分类

Python
我要回答