如何提取单列值的多个部分?

我有一个格式为 YYYY-MM-DD 的日期列。我想从中切出唯一的年份和月份。但我不想要“-”,因为我稍后必须将其转换为整数才能输入到我的线性回归模型中。它当前的数据类型是“object”。


数据框:-


         date   open  close   high    low

0  2019-10-08  56.46  56.10  57.02  56.08

1  2019-10-09  56.76  56.76  56.95  56.41

2  2019-10-10  56.98  57.52  57.61  56.83

3  2019-10-11  58.24  59.05  59.41  58.08

4  2019-10-14  58.73  58.97  59.53  58.67


忽然笑
浏览 132回答 2
2回答

月关宝盒

您可以使用pd.to_datetime转换date列datetime然后使用pd.Series.dt.strftime.s = pd.to_datetime(df['date'])df['date'] = s.dt.strftime("%Y%m") # would give 202010# or# df['date'] = s.dt.strftime("%y%m") # would give 2010

慕妹3146593

日期 --> 您的日期列df['date'] = pd.to_datetime(df['date'])df['date'] = df['date'].apply(lambda x: x.strftime('%Y-%m'))
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python