加入重复行

假设我有这样一个数据框:


                Date    Issuer Ticker  Duplicate Value

0  05/14/20 00:00:00  BARCLAYS     SQ          0   NaN

1  05/11/20 00:00:00  BARCLAYS     SQ          0     1

2  05/11/20 00:00:00     ARGUS    TTD          0   NaN

3  05/11/20 00:00:00     ARGUS    TTD          0     1

4  05/11/20 00:00:00  BARCLAYS     SQ          0   NaN

我想在同一日期发生两次事件时为“重复”赋予值“1”,例如:05/11/20 BARCLAYS SQ(发生两次)并连接两行,以便如果“值”存在它会覆盖另一行中的 NaN。


我会非常感谢一些帮助的人!


谢谢!!!


编辑:加入后的预期输出:


                Date    Issuer Ticker  Duplicate Value

0  05/14/20 00:00:00  BARCLAYS     SQ          0   NaN

1  05/11/20 00:00:00  BARCLAYS     SQ          0     1

3  05/11/20 00:00:00     ARGUS    TTD          0     1


POPMUISE
浏览 80回答 1
1回答

守着一只汪

如果只需要删除具有 3 列名称的重复行的缺失值行,请使用:mask1 = df.duplicated(['Date','Issuer','Ticker'], keep=False)mask2 = df['Value'].notna()df = df[~mask1 | mask2]print (df)                Date    Issuer Ticker  Duplicate  Value0  05/14/20 00:00:00  BARCLAYS     SQ          0    NaN1  05/11/20 00:00:00  BARCLAYS     SQ          0    1.03  05/11/20 00:00:00     ARGUS    TTD          0    1.0
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python