Pandas：根据条件在数据帧组末尾剥离行

对于您发布的特定示例，在分组之前仅删除 NaN 即可：df = df.dropna().groupby('id').apply(lambda x: x.iloc[:-1]).reset_index(drop=True)dfOut[58]:    id       date  numeric  nominal0   1 2002-02-02      0.9        01   1 2003-03-03      0.4        12   2 2005-05-05      0.6        13   3 2008-08-08      0.7        0如果您有一个不连续的 NaN 并且只想删除最后一个 NaN 块：def strip_rows(X):        X = X.iloc[:-1, :]    while pd.isna(X.iloc[-1, 2]):                X = X.iloc[:-1, :]    return Xdf_1 = pd.DataFrame({"id": [1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 3],                   "date": [pd.Timestamp(2002, 2, 2),                            pd.Timestamp(2003, 3, 3),                             pd.Timestamp(2004, 4, 4),                             pd.Timestamp(2005, 5, 5),                             pd.Timestamp(2006, 6, 6),                            pd.Timestamp(2007, 7, 7),                            pd.Timestamp(2008, 8, 8),                            pd.Timestamp(2009, 9, 9),                            pd.Timestamp(2010, 10, 10),                             pd.Timestamp(2011, 11, 11),                            pd.Timestamp(2011, 12, 12),                            pd.Timestamp(2012, 1, 1)],                    "numeric": [0.9, 0.4, 0.2, 0.6, np.nan, 0.8, 0.7, np.nan, np.nan, 0.5, np.nan, 0.3],                    "nominal": [0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1]})df_2 = df_1.groupby('id').apply(strip_rows).reset_index(drop=True)df_1Out[151]:     id       date  numeric  nominal0    1 2002-02-02      0.9        01    1 2003-03-03      0.4        12    1 2004-04-04      0.2        03    2 2005-05-05      0.6        14    2 2006-06-06      NaN        05    2 2007-07-07      0.8        06    3 2008-08-08      0.7        07    3 2009-09-09      NaN        18    3 2010-10-10      NaN        19    3 2011-11-11      0.5        110   3 2011-12-12      NaN        011   3 2012-01-01      0.3        1df_2Out[152]:    id       date  numeric  nominal0   1 2002-02-02      0.9        01   1 2003-03-03      0.4        12   2 2005-05-05      0.6        13   3 2008-08-08      0.7        04   3 2009-09-09      NaN        15   3 2010-10-10      NaN        16   3 2011-11-11      0.5        1

Pandas：根据条件在数据帧组末尾剥离行

1回答