猿问

数据框的特定行是数据框B的特定行的子集吗?

我有两个数据框dfA和dfB,如下所示:


dfA = 

   entityId entityName property value

0         1        bob    propA     a

1         1        bob    propB     b

2         1        bob    propC     c

3         2       dave    propA    aa

4         2       dave    propC     c

5         3        bob    propA     a

6         3        bob    propB    bb

7         3        bob    propD     d

8         4       alex    propE    ee

9         4       alex    propF   fff


dfB = 

   entityId entityValid property value propValid  propId

0       123         yes    propA     a       yes  1

1       123         yes    propB     b       yes  2

2       123         yes    propC     c       yes  3

3       124          no    propA    aa        no  4

4       124          no    propC     c       yes  3

5       125    not sure    propA     a       yes  1

6       125    not sure    propB    bb       yes  5

7       125    not sure    propD     d       yes  6

8       126          no    propE    ee       yes  7

9       126          no    propF    FF       yes  8

我想知道的是,就属性和值列而言,dfA中的哪些实体与dfB中的实体是否完全匹配。


拆开数据帧并首先在单个行中表示每个实体是否最有意义?我正在寻找的最终结果将是这样,但是,任何有关如何解决该问题的意见都是值得的。


resultDf =

      entityId entityName  dfBEntityIdMatch  valid    invalidProps

0            1        bob  123               yes      ()

1            2       dave  124               no       (4)

2            3        bob  125               not sure ()

3            4       alex  '---'             '---'    '---'

提前致谢。

UYOU
浏览 130回答 1
1回答
随时随地看视频慕课网APP

相关分类

Python
我要回答