用相同数据框中的值填充 NaN 信息

NaN如果需要每组的第一个非值，请使用GroupBy.first：df1 = df.groupby([0,1], as_index=False).first()print (df1)   0  1    2    3    4    5     60  x  x  1.0  5.0  7.0  4.0   9.01  x  y  1.0  9.0  4.0  5.0  10.02  y  y  4.0  4.0  4.0  4.0   4.03  y  z  5.0  2.0  7.0  4.0   0.0print (df)   0  1     2     3     4    5     60  x  x  10.0   NaN   NaN  NaN   NaN1  x  x  20.0   NaN   NaN  NaN   NaN2  x  x   1.0   NaN   NaN  NaN   NaN3  x  y   1.0   NaN   NaN  NaN   NaN4  y  y   4.0   4.0   4.0  4.0   4.05  y  z   5.0   2.0   7.0  4.0   0.06  x  x   NaN   5.0   7.0  4.0   9.07  x  x   NaN  50.0  70.0  4.0   9.08  x  y   NaN   9.0   4.0  5.0  10.0如果每个组可能有更多没有 NaN 的行，则会丢失一些数据：df1 = df.groupby([0,1], as_index=False).first()print (df1)   0  1     2    3    4    5     60  x  x  10.0  5.0  7.0  4.0   9.01  x  y   1.0  9.0  4.0  5.0  10.02  y  y   4.0  4.0  4.0  4.0   4.03  y  z   5.0  2.0  7.0  4.0   0.0具有自定义功能的可能解决方案：def f(x):    df1 = pd.DataFrame({y: pd.Series(x[y].dropna().values) for y in x})    return (df1)df = df.set_index([0,1]).groupby([0,1]).apply(f).reset_index(level=2, drop=True).reset_index()print (df)   0  1     2     3     4    5     60  x  x  10.0   5.0   7.0  4.0   9.01  x  x  20.0  50.0  70.0  4.0   9.02  x  x   1.0   NaN   NaN  NaN   NaN3  x  y   1.0   9.0   4.0  5.0  10.04  y  y   4.0   4.0   4.0  4.0   4.05  y  z   5.0   2.0   7.0  4.0   0.0

用相同数据框中的值填充 NaN 信息

1回答