背景
我有一个如下所示的数据集:
product_name price
Women's pant 20.00
Men's Shirt 30.00
Women's Dress 40.00
Blue Shirt 30.00
...
我希望创建一个名为
性别
它将包含基于 product_name 中的字符串的值 Women、Men 或 Unisex
期望的结果如下所示:
product_name price gender
Women's pant 20.00 women
Men's Shirt 30.00 men
Women's Dress 40.00 women
Blue Shirt 30.00 unisex
我的方法
我想首先我应该创建一个新列,每行都有一个空白值。然后我应该遍历数据框中的每一行并检查字符串 df[product_name] 以查看它是男装、女装还是中性并填写相应的性别行值。
这是我的代码:
df['gender'] = ""
for product_name in df['product_name']:
if 'women' in product_name.lower():
df['gender'] = 'women'
elif 'men' in product_name.lower():
df['gender'] = 'men'
else:
df['gender'] = 'unisex'
但是,我得到以下结果:
product_name price gender
Women's pant 20.00 men
Men's Shirt 30.00 men
Women's Dress 40.00 men
Blue Shirt 30.00 men
我非常感谢这里的一些帮助,因为我是 python 和 pandas 库的新手。
米脂
富国沪深
大话西游666
潇潇雨雨
相关分类