我的 jupyter notebook 中有以下数据集作为输入:
Product Year Variable
A 2018 2
A 2019 4
B 2018 2
B 2019 3
我想知道在我的数据集中创建循环或其他东西或排序的最快方法是什么,以便我得到以下输出:
Product Year Variable Row_Num
A 2018 2 1
A 2018 2 2
A 2019 4 1
A 2019 4 2
A 2019 4 3
A 2019 4 4
B 2018 2 1
B 2018 2 2
and so on...
TL;DR - 基于特定列中的变量,我想创建行。例如,如果变量为 3,我想创建该行的 3 个副本,其中一列的值为 1、2、3。
我认为我发现的一种方法是首先根据我的变量创建重复项,然后使用类似于 rank() 或 row_number() 的函数来创建我的“row_num”列。如果任何人都可以分享其他可能的方法来做同样的事情,那将会很有帮助。😄
郎朗坤
相关分类