我在 CSV 中读取了 python 中的数据框。我有一个 DateTimeIndex 和我感兴趣的两列,我们称它们为 number 和 upper_limit。我按索引排序,删除属于旧时间戳的不必要的列和行。然后我计算这两列的最小值、最大值和平均值
numbercol = pd.to_numeric(df.iloc[:,0], errors='coerce')
upperlimitcol = pd.to_numeric(df.iloc[:,1], errors = 'coerce')
这工作正常。现在我想检查数字大于 upper_limit 的频率
for dt in df.index:
if numbercol[dt] >= upperlimitcol[dt]:
overshoots += 1
但我得到一个
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我添加了一个打印语句来查看每个的 number 和 upper_limit 列的值,dt结果证明在 1800 行之后,单元格中的值不再是数字,但看起来像这样(这就是它给我的print(numbercol[dt]))
DateTime
2017-01-14 NaN
2017-01-14 3018.0
Name: Number, dtype: float64
的类型numbercol[dt]也从<type 'numpy.float64'>到<class 'pandas.core.series.Series'>
我在文本编辑器以及 Libre Office 和 Excel 中检查了该文件,但看不出此行与之前的行之间有任何区别。你知道为什么会这样吗?
慕运维8079593
相关分类