我创建了以下数据框
import pandas as pd
df = pd.DataFrame({'parent': ['AC1', 'AC2', 'AC3', 'AC1', 'AC11', 'AC5', 'AC5', 'AC6', 'AC8', 'AC9'],
'child': ['AC2', 'AC3', 'AC4', 'AC11', 'AC12', 'AC2', 'AC6', 'AC7', 'AC9', 'AC10']})
输出以下内容:
parent child
0 AC1 AC2
1 AC2 AC3
2 AC3 AC4
3 AC1 AC11
4 AC11 AC12
5 AC5 AC2
6 AC5 AC6
7 AC6 AC7
8 AC8 AC9
9 AC9 AC10
我想创建一个结果数据框,其中列出了每个父项(意味着它不存在于子列中)和最后一个子项。
df_result = pd.DataFrame({'parent': ['AC1', 'AC1', 'AC5', 'AC5', 'AC8', 'AC2'],
'child': ['AC4', 'AC12', 'AC4', 'AC7', 'AC10', 'AC4']})
parent child
0 AC1 AC4
1 AC1 AC12
2 AC5 AC4
3 AC5 AC7
4 AC8 AC10
5 AC2 AC4
我已经启动了以下功能,但我不确定如何完成它。
def get_child(df):
result = {}
if df['parent'] not in df['child']:
return result[df['parent']]
一只甜甜圈
互换的青春
相关分类