为什么 reindex_like(s, method='ffill') 不同于

我正在尝试使用另一个系列的索引重新索引一个系列并填充缺失值。


pandas版本 1.0.3的演示:


>>> import pandas as pd

>>> s1 = pd.Series(['[0, 1)', '[1, 3)', '[3, 4)', '[4, 6)', '[6, inf)'], index=[0, 1, 3, 4, 6], dtype='string')

>>> s2 = pd.Series(['']*8, index=[6, 2, 5, 0, 4, 7, 1, 3], dtype='string')

>>>

>>> s1

0      [0, 1)

1      [1, 3)

3      [3, 4)

4      [4, 6)

6    [6, inf)

dtype: string

>>> s2

6    

2    

5    

0    

4    

7    

1    

3    

dtype: string

>>> s1.reindex_like(s2).fillna(method='ffill')

6    [6, inf)

2    [6, inf)

5    [6, inf)

0      [0, 1)

4      [4, 6)

7      [4, 6)

1      [1, 3)

3      [3, 4)

dtype: string

>>> s1.reindex_like(s2, method='ffill')

6    [6, inf)

2      [1, 3)

5      [4, 6)

0      [0, 1)

4      [4, 6)

7    [6, inf)

1      [1, 3)

3      [3, 4)

dtype: string

我期望这两种方法的结果相同,为什么它们的行为不同?


慕少森
浏览 81回答 1
1回答

30秒到达战场

第一个选项 ( s1.reindex_like(s2).fillna(method='ffill')) 首先进行重新索引,留下空 ( NaN) 值,然后填充它们。reindex_like回报 [1] :s1.reindex_like(s2)6    [6,inf)2        NaN5        NaN0      [0,1)4      [4,6)7        NaN1      [1,3)3      [3,4)dtype: object现在,您看到fillna(method='ffill')它按系列的顺序向前填充,因为它在此处排序(即它沿着未排序的索引“向前”)。相反,第二个选项 ( s1.reindex_like(s2, method='ffill')) 在排序的索引中进行前向填充。您可以通过将此结果(在对其索引进行排序之后)与首先对 s2 的索引进行排序的结果进行比较来验证此声明:s_when_sort_s2_before = s1.reindex_like(s2.sort_index()).fillna(method='ffill')s_sorted_after = s1.reindex_like(s2, method='ffill').sort_index()pd.testing.assert_series_equal(s_when_sort_s2_before, s_sorted_after)这个断言什么都不做(即不引发AssertionError),因为两者确实相等。[1] 你可以通过我dtype: object知道我和你不是同一个 pandas 版本,但我可以重现这个问题,所以我认为这个解决方案是可行的——在你这边验证一下。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python