使用 Pandas 和 R 将序列号连接到组中的每一行

我有一个如下所示的数据框(下面给出了 R 和 Python 数据框代码)

df = pd.DataFrame({'person_id': [11,11,11,12,12,12,12,13,13,13,13,13,14,14,14]})
df['enc_id'] = [1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579]

person_id <- c(11,11,11,12,12,12,12,13,13,13,13,13,14,14,14)
enc_id <- c(1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579)
df <- data.frame(person_id, enc_id)

我想enc_id为每个人连接一个序列号

我用Python写了类似下面的东西

df['new_enc_id'] = df['enc_id'].map(str) + (df.groupby('person_id').cumcount()+1).map(str)

你能帮我解决以下问题吗?

  1. 我怎样才能在 R 中做到这一点?

  2. 有什么优雅的方法可以在Python中做到这一点吗?

我希望我的输出如下所示。您可以看到sequence number每个组 和 都是串联的not added

https://img4.mukewang.com/64db36f8000103c402890595.jpg

四季花海
浏览 159回答 4
4回答

跃然一笑

您的解决方案很好,只有我用于astype转换为字符串:df['new_enc_id']&nbsp;=&nbsp;(df['enc_id'].astype(str)&nbsp;+&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;(df.groupby('person_id').cumcount()+1).astype(str))

达令说

在R中df&nbsp;=&nbsp;df&nbsp;%>%&nbsp;group_by(person_id)&nbsp;%>%&nbsp;dplyr::mutate(new_enc_id&nbsp;=&nbsp;paste0(enc_id,row_number())&nbsp;)

SMILET

在空间内R,您可以通过以下方式获得相同的结果data.table:setDT(df) df[, paste0(enc_id,row.names(.SD)), by=person_id]

梵蒂冈之花

transform使用+的基本 R 选项avedf <- transform(&nbsp; df,&nbsp; new_enc_id = paste0(new_enc_id, ave(1:nrow(df), person_id, FUN = seq_along)))
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python