我有两个数据框dfA和dfB,如下所示:
dfA =
entityId entityName property value
0 1 bob propA a
1 1 bob propB b
2 1 bob propC c
3 2 dave propA aa
4 2 dave propC c
5 3 bob propA a
6 3 bob propB bb
7 3 bob propD d
8 4 alex propE ee
9 4 alex propF fff
dfB =
entityId entityValid property value propValid propId
0 123 yes propA a yes 1
1 123 yes propB b yes 2
2 123 yes propC c yes 3
3 124 no propA aa no 4
4 124 no propC c yes 3
5 125 not sure propA a yes 1
6 125 not sure propB bb yes 5
7 125 not sure propD d yes 6
8 126 no propE ee yes 7
9 126 no propF FF yes 8
我想知道的是,就属性和值列而言,dfA中的哪些实体与dfB中的实体是否完全匹配。
拆开数据帧并首先在单个行中表示每个实体是否最有意义?我正在寻找的最终结果将是这样,但是,任何有关如何解决该问题的意见都是值得的。
resultDf =
entityId entityName dfBEntityIdMatch valid invalidProps
0 1 bob 123 yes ()
1 2 dave 124 no (4)
2 3 bob 125 not sure ()
3 4 alex '---' '---' '---'
提前致谢。
相关分类