没有值的 Pandas MultiIndex

我正在使用 MultiIndex,数据来自数据库。我想用作键的一些值是空的。我发现这会导致数据被省略。例如


import numpy as np

import pandas as pd

import sys


print(sys.version)  # 3.7.3

print(pd.__version__) # 1.0.3

idx = pd.MultiIndex.from_tuples([('A', 'a'), ('A', 'b'), ('B', 'a'), ('B', ' '), ('C', 'a'), ('C', None), ('D', '')], names=['Level 1', 'Level 2'])

print(idx)

d = {'X':{('A','a'):1, ('A','b'):2, ('B','a'):3, ('B',' '):4, ('C','a'): 5, ('C',None): 6, ('D',''):7},

'Y':{('A','a'):1, ('C',None): 6, ('D',''):7}

}

df = pd.DataFrame(data=d, index=idx)

print(df)

结果是:


MultiIndex([('A', 'a'),

            ('A', 'b'),

            ('B', 'a'),

            ('B', ' '),

            ('C', 'a'),

            ('C', nan),

            ('D',  '')],

           names=['Level 1', 'Level 2'])

                   X    Y

Level 1 Level 2

A       a        1.0  1.0

        b        2.0  NaN

B       a        3.0  NaN

                 4.0  NaN

C       a        5.0  NaN

        NaN      NaN  NaN

D                7.0  7.0

我的问题是 C/None 行,它给了我NaN而不是 6。其他空白值(空字符串、空格)没有这种行为。


这是可以预料的还是我需要以某种方式配置 MultiIndex?


慕桂英3389331
浏览 92回答 1
1回答

胡子哥哥

当索引中有 NaN 时,这是不安全的:github1 github2对于简单的修复,您可以将数据加载到数据框,然后fillna再set_index返回
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python