猿问

pandas:使用`DataFrame.fillna` 来填充`DataFrame.add

该DataFrame.add(fill_value=my_value)方法允许你添加到数据帧,并选择一个单一的值my_value将用于替换缺失值。


另一方面,它DataFrame.fillna为填充缺失值提供了更大的灵活性(例如,允许您用每列的最后一个有效值填充尾随缺失值),但只能应用于已经存在的数据帧。


有没有什么方法可以在使用时DataFrame.fillna在添加两个数据帧期间使用类似的东西来填充缺失值DataFrame.add,而不是单个值?


例如。我想执行相当于


import pandas as pd

A = pd.Series(data=[1,2,3], index=['a', 'b', 'c'])

B = pd.Series(data=[1,2,3], index=['b', 'c', 'd'])

frame = pd.DataFrame({'a': A, 'b': B})

frame = frame.fillna(method='pad') # pad trailing missing values with last valid ones, column-wise

frame = frame.fillna(value=0) # pad (remaining) leading values with zeros

result = frame.sum(axis=1)

但使用A.add(B, unknown_params). 如果那不可用,有没有比我目前正在做的更有效的其他方法?


繁华开满天机
浏览 245回答 1
1回答

达令说

不存在执行所有操作的通用魔法方法。您可以创建一个函数,利用方法链并使用pd.DataFrame.pipe使您的代码更清晰:def fill_sum(df):    return df.fillna(method='pad').fillna(0).sum(1)frame = pd.DataFrame({'a': A, 'b': B})frame = frame.pipe(fill_sum)print(frame)a    1.0b    3.0c    5.0d    6.0dtype: float64
随时随地看视频慕课网APP

相关分类

Python
我要回答