我有一个多级数据框,我想将 column 中的值secret与 column 上的条件进行比较group。如果 group = A,我们允许另一个数据帧中的值为空或 na。否则,对于不匹配的,输出 INVALID。
多级数据框:
name secret group
df1 df2 df1 df2 df1 df2
id
1 Tim Tim random na A A
2 Tom Tom tree A A
3 Alex Alex apple apple B B
4 May May file cheese C C
秘密的预期输出
id name secret group
1 Tim na A
2 Tom A
3 Alex apple B
4 May INVALID C
到目前为止我有:
result_df['result'] = multilevel_df.groupby(level=0, axis=0).apply(lambda x: secret_check(x))
#take care of the rest by compare column by column
result_df = multilevel_df.groupby(level=0, axis=1).apply(lambda x: validate(x))
def validate(x):
if x[0] == x[1]:
return x[1]
else:
return 'INVALID'
def secret_check(x):
if (x['group'] == 'A' and pd.isnull(['secret']): #this line is off
return x[1]
elif x[0] == x[1]:
return x[1]
else:
return 'INVALID'
守候你守候我
相关分类