循环数据框的每一行,并根据条件向数据框添加元素

我想循环数据框的每一行,如果列和列表中的字符串之间存在匹配,我会在新列中添加一个元素。在此示例中,我想添加一个新列来对产品进行分类。因此,如果该列的一行与其中一个列表匹配,则类别可以是“饮料”或“食品”,如果没有匹配,则类别将为其他。


list_drinks={'Water','Juice','Tea'}

list_food={'Apple','Orange'}

data = {'Price':  ['1', '5','3'], 'Product': ['Juice','book', Pen]}

for (i,j) in itertools.zip_longest(list_drinks,list_food):

    for index in data.index: 

        if(j in data.loc[index,'product']):

            data["Category"] = "Food"

        elif(i in data.loc[index,'product']):

            data["Category"] ="drinks"

        else:

            data["Category"]="Other"

           

输出将是:


Price  Product Category

 1      Juice    drinks

 5      book     Other

 3      Pen      Other

我的问题主要是我不知道如何匹配列表和行之间的模式。我也尝试过: str.contains但没有成功。


慕码人8056858
浏览 78回答 2
2回答

精慕HU

无需循环。您可以使用.isin()withnp.select()根据条件返回结果。见下面的代码:import pandas as pdimport numpy as nplist_drinks=['Water','Juice','Tea']list_food=['Apple','Orange']data = {'Price':  ['1', '5','3'],    'Product': ['Juice','book','Pen']}df = pd.DataFrame(data)df['Category'] = np.select([(df['Product'].isin(list_drinks)),               (df['Product'].isin(list_food))],              ['drinks',              'food'], 'Other')dfOut[1]:   Price Product Category0     1   Juice   drinks1     5    book    Other2     3     Pen    Other下面,我将代码分解为更详细的内容,以便您可以了解它是如何工作的。我也根据你的评论略有改变。我使用列表理解和 来检查列表中的值是否位于数据帧中的值的子字符串中in。为了提高匹配率,我还将 as 全部小写与 进行比较.lower():import pandas as pdimport numpy as nplist_drinks=['Water','Juice','Tea']list_food=['Apple','Orange']data = {'Price':  ['1', '5','3'],    'Product': ['green Juice','book','oRange you gonna say banana']}df = pd.DataFrame(data)c1 = (df['Product'].apply(lambda x: len([y for y in list_drinks if y.lower() in x.lower()]) > 0))c2 = (df['Product'].apply(lambda x: len([y for y in list_food if y.lower() in x.lower()]) > 0))r1 = 'drinks'r2 = 'food'conditions = [c1,c2]results= [r1,r2]df['Category'] = np.select(conditions, results, 'Other')dfOut[1]:   Price                      Product Category0     1                  green Juice   drinks1     5                         book    Other2     3  oRange you gonna say banana     food

凤凰求蛊

这是一个替代方案 -import itertoolsimport pandas as pdlist_drinks={'Water','Juice','Tea'}list_food={'Apple','Orange'}data = pd.DataFrame({'Price':  ['1', '5','3'], 'Product': ['Juice','book', 'Pen']})category = list()for prod in data['Product']:     if prod in list_food:        category.append("Food")    elif prod in list_drinks:        category.append("drinks")    else:        category.append("Other")data['Category']= categoryprint(data)输出-Price  Product Category 1      Juice    drinks 5      book     Other 3      Pen      Other
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python