我有一个大约 15 列的 Pandas 数据框,我想要做的就是查看 partition_num 第一行中的数据是否等于 partition_num 最后一行中的数据,如果不相等,则在末尾添加一个新行第一行的数据
输入:
row id partition_num lat long time
0 1 7333 24 26 9
1 2 7333 15 19 10
2 3 7333 24 25 9
3 1 8999 26 18 15
4 2 8999 15 17 45
5 3 8999 26 18 15
6 1 3455 12 14 18
7 2 3455 12 14 18
期望的输出:
row id partition_num lat long time
0 1 7333 24 26 9
1 2 7333 15 19 10
2 3 7333 25 26 9
3 4 7333 24 26 9
4 1 8999 26 18 15
5 2 8999 15 17 45
6 3 8999 26 18 15
7 1 3455 12 14 18
8 2 3455 12 14 18
由于第0行中partition_num -7333的数据不等于第2行的数据,因此添加一个与第0行数据相同的新行(第3行)
我们可以添加一个新列来标识新记录,例如 flag :
row id partition_num lat long time flag
0 1 7333 24 26 9 old
1 2 7333 15 19 10 old
2 3 7333 25 26 9 old
3 4 7333 24 26 9 new
4 1 8999 26 18 15 old
5 2 8999 15 17 45 old
6 3 8999 26 18 15 old
7 1 3455 12 14 18 old
8 2 3455 12 14 18 old
慕雪6442864
森林海
HUH函数
相关分类