对数据帧中组内的行进行编号

4回答

慕姐8265434

因为我做了这个r-常见问题更完整的问题，一个基本的R选项sequence和rle:df$num <- sequence(rle(df$cat)$lengths)它给出了预期的结果：> df   cat        val num4  aaa 0.05638315   12  aaa 0.25767250   21  aaa 0.30776611   35  aaa 0.46854928   43  aaa 0.55232243   510 bbb 0.17026205   18  bbb 0.37032054   26  bbb 0.48377074   39  bbb 0.54655860   47  bbb 0.81240262   513 ccc 0.28035384   114 ccc 0.39848790   211 ccc 0.62499648   315 ccc 0.76255108   412 ccc 0.88216552   5如果df$cat是一个因素变量，您需要将它包装在as.character第一：df$num <- sequence(rle(as.character(df$cat))$lengths)

0 0

繁花不似锦

下面是使用for按组循环，而不是按行循环(就像OP做的那样)for (i in unique(df$cat)) df$num[df$cat == i] <- seq_len(sum(df$cat == i))

0 0

BIG阳

我想添加一个data.table变量使用rank()函数，它提供了更改顺序的额外可能性，从而使其比seq_len()解决方案，非常类似于RDBMS中的行号函数。# Variant with ascending orderinglibrary(data.table)dt <- data.table(df)dt[, .( val   , num = rank(val))    , by = list(cat)][order(cat, num),]    cat        val num 1: aaa 0.05638315   1 2: aaa 0.25767250   2 3: aaa 0.30776611   3 4: aaa 0.46854928   4 5: aaa 0.55232243   5 6: bbb 0.17026205   1 7: bbb 0.37032054   2 8: bbb 0.48377074   3 9: bbb 0.54655860   410: bbb 0.81240262   511: ccc 0.28035384   112: ccc 0.39848790   213: ccc 0.62499648   314: ccc 0.76255108   4# Variant with descending orderingdt[, .( val   , num = rank(-val))    , by = list(cat)][order(cat, num),]

0 0