我有一些文本通常以以下内容开头:
“12 minutes ago - There was a meeting...”
“2 hours ago - Apologies for being...”
“1 day ago - It is a sunny day in London...”
等等。基本上我有以下信息:
Minutes
Hours
Day (starting from today)
我想将此类信息转换为有价值的时间序列信息,以便提取这部分并从中创建一个新列(日期时间)。在我的数据集中,我有一列(日期),其中我已经有执行研究的日期(例如,今天),格式为:26/05/2020 和提交搜索的时间(例如上午 8:41 ). 因此,如果文本以“12 分钟前”开头,我应该:
26/05/2020 - 8:29 (datetime format in Python)
对于其他人:
26/05/2020 - 6:41
25/05/2020 - 8:41
重要的是要有一些东西(字符串、数字、日期格式),我可以将其绘制为时间序列(我想看看在时间间隔方面发布了多少文本)。关于如何做到这一点的任何想法?
慕标琳琳
明月笑刀无情
相关分类