猿问

使用.map()在pandas DataFrame中有效创建其他列

我正在分析形状类似于以下示例的数据集。我有两种不同类型的数据(abc数据和xyz数据):


   abc1  abc2  abc3  xyz1  xyz2  xyz3

0     1     2     2     2     1     2

1     2     1     1     2     1     1

2     2     2     1     2     2     2

3     1     2     1     1     1     1

4     1     1     2     1     2     1

我想创建一个为数据框中存在的每个abc列添加一个分类列的函数。使用列名列表和类别映射字典,我可以获得所需的结果。


abc_columns = ['abc1', 'abc2', 'abc3']

xyz_columns = ['xyz1', 'xyz2', 'xyz3']

abc_category_columns = ['abc1_category', 'abc2_category', 'abc3_category']

categories = {1: 'Good', 2: 'Bad', 3: 'Ugly'}


for i in range(len(abc_category_columns)):

    df3[abc_category_columns[i]] = df3[abc_columns[i]].map(categories)


print df3

最终结果:


   abc1  abc2  abc3  xyz1  xyz2  xyz3 abc1_category abc2_category abc3_category

0     1     2     2     2     1     2          Good           Bad           Bad

1     2     1     1     2     1     1           Bad          Good          Good

2     2     2     1     2     2     2           Bad           Bad          Good

3     1     2     1     1     1     1          Good           Bad          Good

4     1     1     2     1     2     1          Good          Good           Bad

虽然最后的for循环工作正常,但我觉得我应该使用Python的lambda函数,但似乎无法弄清楚。


有没有更有效的方法来映射动态数量的abc类型的列?


Helenr
浏览 290回答 1
1回答

慕仙森

您可以将applymap其与dictionaryget方法一起使用:In [11]: df[abc_columns].applymap(categories.get)Out[11]:   abc1  abc2  abc30  Good   Bad   Bad1   Bad  Good  Good2   Bad   Bad  Good3  Good   Bad  Good4  Good  Good   Bad并将其放入指定的列:In [12]: abc_categories = map(lambda x: x + '_category', abc_columns)In [13]: abc_categoriesOut[13]: ['abc1_category', 'abc2_category', 'abc3_category']In [14]: df[abc_categories] = df[abc_columns].applymap(categories.get)注意:您可以abc_columns使用列表推导来相对有效地构建:abc_columns = [col for col in df.columns if str(col).startswith('abc')]
随时随地看视频慕课网APP

相关分类

Python
我要回答