在 Pandas 上创建变量时出错 - 传递的项目数错误

我收到错误消息:ValueError:错误的项目数为 3,放置意味着 1,我正在努力弄清楚从哪里开始,以及如何开始解决这个问题。


我不太明白错误的含义;这让我很难排除故障。我还在我的 Jupyter Notebook 中包含了触发错误的代码块。


根据许多条件,我无法在数据帧上创建变量。


我希望根据条件的答案添加一个带有二进制变量“是”/“否”的列。


我的数据框是从 11 列的 CSV 文件构建的。


我试试这个代码:


import pandas as pd


import numpy as np


df['yes/no'] = np.where(df[(df['var_1'].isin(list)) & (df['var2'] >= '2000-01-01') & (df['var_2'] <= '2000-12-31') & (df['var_3'] >0) & (df['var_4'] =='OK')],'yes','No')

我认为问题来自变量的创建,因为没有np.where条件的代码是正确的。


但是当我想用这些条件创建一个变量并执行代码时,它会显示错误:


Wrong number of items passed 12, placement implies 1

您知道该错误意味着什么以及如何解决吗?


森林海
浏览 328回答 1
1回答

子衿沉夜

np.where返回一个大小仅为它找到的匹配数的数组。如果你想在你的 df 中添加一列,你需要一个大小相同的系列,True或者False取决于条件。为此,只需使用一个裸条件:df['yes/no'] = 'No'rows = (df['var_1'].isin(list)) &&nbsp;&nbsp; &nbsp; (df['var2'] >= '2000-01-01') &&nbsp;&nbsp; &nbsp; (df['var_2'] <= '2000-12-31') &&nbsp;&nbsp; &nbsp; (df['var_3'] >0) &&nbsp;&nbsp; &nbsp; &nbsp;(df['var_4'] =='OK')df.loc[rows, 'yes/no'] = 'yes'
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python