我有一个如下所示的数据框(下面给出了 R 和 Python 数据框代码)
df = pd.DataFrame({'person_id': [11,11,11,12,12,12,12,13,13,13,13,13,14,14,14]}) df['enc_id'] = [1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579] person_id <- c(11,11,11,12,12,12,12,13,13,13,13,13,14,14,14) enc_id <- c(1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579) df <- data.frame(person_id, enc_id)
我想enc_id
为每个人连接一个序列号
我用Python写了类似下面的东西
df['new_enc_id'] = df['enc_id'].map(str) + (df.groupby('person_id').cumcount()+1).map(str)
你能帮我解决以下问题吗?
我怎样才能在 R 中做到这一点?
有什么优雅的方法可以在Python中做到这一点吗?
我希望我的输出如下所示。您可以看到sequence number
每个组 和 都是串联的not added
。
跃然一笑
达令说
SMILET
梵蒂冈之花
相关分类