我试图从存储在数据框列中的凌乱文本字符串中提取年份和降雨量值,并将它们保存到新列中。在使用不同的切片方法进行测试失败后,我通过列表推导完成了它。列表理解是提取字符串子集进行广播的最佳方法吗?
非常感谢大家!
df = pd.DataFrame([' 1883 1 6.3 1.7 6 122.1 ---',
' 1883 2 8.0 2.8 2 69.8 ---',
' 1883 3 4.8 -1.6 23 29.6 ---',])
df['split'] = df[0].str.split()
df['year'] = [df['split'][i][0] for i in df.index]
df['rainfall'] = [float(df['split'][i][5]) for i in df.index]
慕的地10843
相关分类