我是 pandas 库的初学者,不知道如何解决这个问题。我有一个巨大的数据框(我正在实现 Mask-RCNN 模型,然后使用以下数据框但包含更多列生成 CSV)。
Object_id Detection_class Detection_score Proportion_bounding_box
0 3 0.970 2.26
1 3 0.954 23.16
2 4 0.696 6.23
3 9 0.658 0.26
0 3 0.980 13.16
1 4 0.984 5.12
2 45 0.255 0.06
... ... ... ...
我想要实现的是添加一个新列,其中包含满足条件的总和。在这种情况下,我想对 等于 3 或 4 的值求和。Proportion_bounding_box此外Detection_class,其中Detection_score> .60
我尝试过groupby()功能成功。值得一提的是,每次Object_id从 0 重新开始时,它都是在对另一张图像中的对象进行计数,因此总和需要从 0 重新开始。
有这样的输出
Object_id Detection_class Detection_score Proportion_bounding_box Sum_cars_trucks
0 3 0.970 2.26 31.65
1 3 0.954 23.16 31.65
2 4 0.456 6.23 31.65
3 9 0.658 0.26 31.65
0 3 0.980 13.16 18.28
1 4 0.984 5.12 18.28
2 45 0.255 0.06 18.28
... ... ... ...
更准确地说,值 31.65 是 2.26 + 23.16 + 6.23 的总和,因为满足条件,然后当变为Object_id0 时再次开始求和。如果在本例中重复求和值 31.65 ,则没有问题。的值Detection_class不是 3 或 4 的行(即Object_id第 4 行的值为 9 ),无论如何我都必须在之后清理数据。
任何想法将不胜感激。
倚天杖
相关分类