猿问

熊猫系列/数据栏的条件创建

熊猫系列/数据栏的条件创建

我有一份数据,大致如下:


    Type       Set

1    A          Z

2    B          Z           

3    B          X

4    C          Y

我希望向dataframe(或生成一个序列)中添加另一列,其长度与dataframe(=相等的记录/行数)相同,如果设置为‘Z’,则设置颜色为绿色;如果设置为“否则”,则设置‘red’。


做这件事最好的方法是什么?


函数式编程
浏览 472回答 3
3回答

qq_笑_17

列表理解是另一种有条件地创建另一列的方法。如果您正在使用列中的对象dtype(如您的示例中所示),则列表理解通常优于大多数其他方法。示例列表理解:df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]%timeit测试:import pandas as pdimport numpy as npdf = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})%timeit df['color'] = ['red' if x == 'Z' else 'green' for x in df['Set']]%timeit df['color'] = np.where(df['Set']=='Z', 'green', 'red')%timeit df['color'] = df.Set.map( lambda x: 'red' if x == 'Z' else 'green')1000 loops, best of 3: 239 µs per loop1000 loops, best of 3: 523 µs per loop1000 loops, best of 3: 263 µs per loop

MYYA

下面还有另一种方法,使用字典将新值映射到列表中的键上,从而剥去这只猫的皮:def map_values(row, values_dict):    return values_dict[row]values_dict = {'A': 1, 'B': 2, 'C': 3, 'D': 4}df = pd.DataFrame({'INDICATOR': ['A', 'B', 'C', 'D'], 'VALUE': [10, 9, 8, 7]})df['NEW_VALUE'] = df['INDICATOR'].apply(map_values, args = (values_dict,))它是什么样子的:dfOut[2]:   INDICATOR  VALUE  NEW_VALUE0         A     10          11         B      9          22         C      8          33         D      7          4当您有许多方法时,这种方法可能非常强大。ifelse-要进行的类型声明(即许多要替换的唯一值)。当然,你也可以这样做:df['NEW_VALUE'] = df['INDICATOR'].map(values_dict)但是这种方法的速度是apply从上面靠近,在我的机器上。您也可以这样做,使用dict.get:df['NEW_VALUE'] = [values_dict.get(v, None) for v in df['INDICATOR']]
随时随地看视频慕课网APP

相关分类

Python
我要回答